home.social

#litellm — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #litellm, aggregated by home.social.

  1. Как мы построили корпоративную LLM-платформу: архитектура, грабли и выводы

    Обычно внедрение AI в компаниях происходит по такому сценарию: собрали одного ассистента, показали руководству, получили аплодисменты. Потом второго, третьего — и через полгода получается зоопарк с разными ключами, моделями и неконтролируемым бюджетом. Вместо набора разрозненных ассистентов мы сразу пошли в платформу. В статье рассказываем, из чего она состоит, как эволюционировало наше железо, зачем понадобилось два слоя наблюдаемости и почему маркетплейсный RAG ломается на PDF-файлах. С графиками, схемой архитектуры и выводами, которые сами хотели бы прочитать год назад.

    habr.com/ru/companies/sminex_d

    #ai #llm #openwebui #langflow #langfuse #litellm #vllm #openai

  2. Как мы построили корпоративную LLM-платформу: архитектура, грабли и выводы

    Обычно внедрение AI в компаниях происходит по такому сценарию: собрали одного ассистента, показали руководству, получили аплодисменты. Потом второго, третьего — и через полгода получается зоопарк с разными ключами, моделями и неконтролируемым бюджетом. Вместо набора разрозненных ассистентов мы сразу пошли в платформу. В статье рассказываем, из чего она состоит, как эволюционировало наше железо, зачем понадобилось два слоя наблюдаемости и почему маркетплейсный RAG ломается на PDF-файлах. С графиками, схемой архитектуры и выводами, которые сами хотели бы прочитать год назад.

    habr.com/ru/companies/sminex_d

    #ai #llm #openwebui #langflow #langfuse #litellm #vllm #openai

  3. Как мы построили корпоративную LLM-платформу: архитектура, грабли и выводы

    Обычно внедрение AI в компаниях происходит по такому сценарию: собрали одного ассистента, показали руководству, получили аплодисменты. Потом второго, третьего — и через полгода получается зоопарк с разными ключами, моделями и неконтролируемым бюджетом. Вместо набора разрозненных ассистентов мы сразу пошли в платформу. В статье рассказываем, из чего она состоит, как эволюционировало наше железо, зачем понадобилось два слоя наблюдаемости и почему маркетплейсный RAG ломается на PDF-файлах. С графиками, схемой архитектуры и выводами, которые сами хотели бы прочитать год назад.

    habr.com/ru/companies/sminex_d

    #ai #llm #openwebui #langflow #langfuse #litellm #vllm #openai

  4. Как мы построили корпоративную LLM-платформу: архитектура, грабли и выводы

    Обычно внедрение AI в компаниях происходит по такому сценарию: собрали одного ассистента, показали руководству, получили аплодисменты. Потом второго, третьего — и через полгода получается зоопарк с разными ключами, моделями и неконтролируемым бюджетом. Вместо набора разрозненных ассистентов мы сразу пошли в платформу. В статье рассказываем, из чего она состоит, как эволюционировало наше железо, зачем понадобилось два слоя наблюдаемости и почему маркетплейсный RAG ломается на PDF-файлах. С графиками, схемой архитектуры и выводами, которые сами хотели бы прочитать год назад.

    habr.com/ru/companies/sminex_d

    #ai #llm #openwebui #langflow #langfuse #litellm #vllm #openai

  5. I have other things I need to explore. I found a DoS (authed unfortunately) in #litellm as well but I want to do something creative with it.

  6. I have other things I need to explore. I found a DoS (authed unfortunately) in #litellm as well but I want to do something creative with it.

  7. I have other things I need to explore. I found a DoS (authed unfortunately) in #litellm as well but I want to do something creative with it.

  8. I have other things I need to explore. I found a DoS (authed unfortunately) in #litellm as well but I want to do something creative with it.

  9. I have other things I need to explore. I found a DoS (authed unfortunately) in #litellm as well but I want to do something creative with it.

  10. Data Breaches Surge, Exposing Sensitive Info at AI Startups, Agencies

    Data breaches are surging, with AI startups and agencies exposed, as seen in the alarming theft of 10 petabytes from a Chinese supercomputer and 4 terabytes from AI startup Mercor due to a supply-chain vulnerability. These incidents highlight the hidden risks of connecting data to AI models, creating sensitive blind spots that leave large…

    osintsights.com/data-breaches-

    #AiStartups #DataBreaches #EmergingThreats #Litellm #Mercor

  11. Embeddings models from #Scaleway weren't working with #LiteLLM. Couple of hours of searching and testing, it's a three line fix. 😅

    github.com/BerriAI/litellm/pul

  12. Embeddings models from #Scaleway weren't working with #LiteLLM. Couple of hours of searching and testing, it's a three line fix. 😅

    github.com/BerriAI/litellm/pul

  13. Embeddings models from #Scaleway weren't working with #LiteLLM. Couple of hours of searching and testing, it's a three line fix. 😅

    github.com/BerriAI/litellm/pul

  14. Embeddings models from #Scaleway weren't working with #LiteLLM. Couple of hours of searching and testing, it's a three line fix. 😅

    github.com/BerriAI/litellm/pul

  15. Embeddings models from #Scaleway weren't working with #LiteLLM. Couple of hours of searching and testing, it's a three line fix. 😅

    github.com/BerriAI/litellm/pul

  16. 🔐 LiteLLM sotto assedio: scoperta falla che mette a rischio le chiavi IA. Tempo di rinforzare la sicurezza! #LiteLLM #CyberSecurity

    🔗 tomshw.it/hardware/litellm-sot

  17. 🔐 LiteLLM sotto assedio: scoperta falla che mette a rischio le chiavi IA. Tempo di rinforzare la sicurezza! #LiteLLM #CyberSecurity

    🔗 tomshw.it/hardware/litellm-sot

  18. 🔐 LiteLLM sotto assedio: scoperta falla che mette a rischio le chiavi IA. Tempo di rinforzare la sicurezza! #LiteLLM #CyberSecurity

    🔗 tomshw.it/hardware/litellm-sot

  19. LiteLLM SQL Flaw Exploited 36 Hours After Disclosure

    A critical SQL injection flaw, CVE-2026-42208, was exploited just 36 hours after its disclosure, putting vulnerable LiteLLM versions at risk of unauthorized database access. The bug, with a CVSS score of 9.3, allows unauthenticated callers to reach a vulnerable database query through the proxy's error-handling path.

    osintsights.com/litellm-sql-fl

    #SqlInjection #Litellm #Cve202642208 #Python #EmergingThreats

  20. Urgent security alert: Hackers are exploiting a pre-authentication SQL injection flaw (CVE-2026-42208) in LiteLLM, allowing them to bypass authentication and exfiltrate sensitive AI provider credentials. Sysdig Threat Research Team observed attackers moving directly to high-value tables, demonstrating precise knowledge. This vulnerability's impact is comparable to a full cloud-account…

    tpp.blog/1dqwzx7

    #cybersecurity #litellm #cve202642208

    🤖 This post was AI-generated.

  21. Hackers Exploit LiteLLM SQL Flaw for Sensitive Data Access

    Within just 36 hours of being publicly disclosed, a critical SQL injection flaw in LiteLLM, known as CVE-2026-42208, was actively exploited by hackers, allowing them to access sensitive data without authentication. This alarming vulnerability highlights the importance of swift patching, with LiteLLM version 1.83.7 now available to…

    osintsights.com/hackers-exploi

    #SqlInjection #Litellm #Cve202642208 #EmergingThreats #PreauthenticationExploit

  22. Hackers Exploit LiteLLM SQL Flaw for Sensitive Data Access

    Within just 36 hours of being publicly disclosed, a critical SQL injection flaw in LiteLLM, known as CVE-2026-42208, was actively exploited by hackers, allowing them to access sensitive data without authentication. This alarming vulnerability highlights the importance of swift patching, with LiteLLM version 1.83.7 now available to…

    osintsights.com/hackers-exploi

    #SqlInjection #Litellm #Cve202642208 #EmergingThreats #PreauthenticationExploit

  23. Auto AI Router: высокопроизводительный прокси-роутер для LLM API на Go

    Auto AI Router — лёгкий прокси-роутер на Go, который принимает запросы в формате OpenAI API и прозрачно распределяет их между несколькими провайдерами и ключами с балансировкой нагрузки, защитой от банов и контролем RPM-лимитов. Читать далее (многобукав)

    habr.com/ru/articles/1027878/

    #go #github #llm #openai #vertex #gemini #litellm #docker #dockercompose #router

  24. Auto AI Router: высокопроизводительный прокси-роутер для LLM API на Go

    Auto AI Router — лёгкий прокси-роутер на Go, который принимает запросы в формате OpenAI API и прозрачно распределяет их между несколькими провайдерами и ключами с балансировкой нагрузки, защитой от банов и контролем RPM-лимитов. Читать далее (многобукав)

    habr.com/ru/articles/1027878/

    #go #github #llm #openai #vertex #gemini #litellm #docker #dockercompose #router

  25. Auto AI Router: высокопроизводительный прокси-роутер для LLM API на Go

    Auto AI Router — лёгкий прокси-роутер на Go, который принимает запросы в формате OpenAI API и прозрачно распределяет их между несколькими провайдерами и ключами с балансировкой нагрузки, защитой от банов и контролем RPM-лимитов. Читать далее (многобукав)

    habr.com/ru/articles/1027878/

    #go #github #llm #openai #vertex #gemini #litellm #docker #dockercompose #router

  26. Auto AI Router: высокопроизводительный прокси-роутер для LLM API на Go

    Auto AI Router — лёгкий прокси-роутер на Go, который принимает запросы в формате OpenAI API и прозрачно распределяет их между несколькими провайдерами и ключами с балансировкой нагрузки, защитой от банов и контролем RPM-лимитов. Читать далее (многобукав)

    habr.com/ru/articles/1027878/

    #go #github #llm #openai #vertex #gemini #litellm #docker #dockercompose #router

  27. Как подключить Langfuse к LLM через JWT?

    Langfuse, помимо трассирования запросов, удобно использовать для prompt management и LLM-as-a-judge. Но в закрытой корпоративной среде он упирается в простую вещь: LF работает со статическим API key, а ваш LLM gateway — нет. То есть gateway требует короткоживущий JWT, а Langfuse не умеет его получать. И в этот момент интеграция ломается. Мы столкнулись именно с такой ситуацией. Модели self-hosted, OpenAI подобный API, но для доступа к нему на каждый запрос нужен JWT, который выдаётся централизованным провайдером. Langfuse в LLM Connection умеет передать API key и заголовки, но не сможет сам сходить в auth-сервис, получить временный токен и подставить его в запрос. В этой статье я рассказываю о своем опыте решения этой проблемы на продакшен уровне.

    habr.com/ru/articles/1025168/

    #llm #litellm #fastapi #proxy #proxyserver #langfuse

  28. Как подключить Langfuse к LLM через JWT?

    Langfuse, помимо трассирования запросов, удобно использовать для prompt management и LLM-as-a-judge. Но в закрытой корпоративной среде он упирается в простую вещь: LF работает со статическим API key, а ваш LLM gateway — нет. То есть gateway требует короткоживущий JWT, а Langfuse не умеет его получать. И в этот момент интеграция ломается. Мы столкнулись именно с такой ситуацией. Модели self-hosted, OpenAI подобный API, но для доступа к нему на каждый запрос нужен JWT, который выдаётся централизованным провайдером. Langfuse в LLM Connection умеет передать API key и заголовки, но не сможет сам сходить в auth-сервис, получить временный токен и подставить его в запрос. В этой статье я рассказываю о своем опыте решения этой проблемы на продакшен уровне.

    habr.com/ru/articles/1025168/

    #llm #litellm #fastapi #proxy #proxyserver #langfuse

  29. Как подключить Langfuse к LLM через JWT?

    Langfuse, помимо трассирования запросов, удобно использовать для prompt management и LLM-as-a-judge. Но в закрытой корпоративной среде он упирается в простую вещь: LF работает со статическим API key, а ваш LLM gateway — нет. То есть gateway требует короткоживущий JWT, а Langfuse не умеет его получать. И в этот момент интеграция ломается. Мы столкнулись именно с такой ситуацией. Модели self-hosted, OpenAI подобный API, но для доступа к нему на каждый запрос нужен JWT, который выдаётся централизованным провайдером. Langfuse в LLM Connection умеет передать API key и заголовки, но не сможет сам сходить в auth-сервис, получить временный токен и подставить его в запрос. В этой статье я рассказываю о своем опыте решения этой проблемы на продакшен уровне.

    habr.com/ru/articles/1025168/

    #llm #litellm #fastapi #proxy #proxyserver #langfuse

  30. Как подключить Langfuse к LLM через JWT?

    Langfuse, помимо трассирования запросов, удобно использовать для prompt management и LLM-as-a-judge. Но в закрытой корпоративной среде он упирается в простую вещь: LF работает со статическим API key, а ваш LLM gateway — нет. То есть gateway требует короткоживущий JWT, а Langfuse не умеет его получать. И в этот момент интеграция ломается. Мы столкнулись именно с такой ситуацией. Модели self-hosted, OpenAI подобный API, но для доступа к нему на каждый запрос нужен JWT, который выдаётся централизованным провайдером. Langfuse в LLM Connection умеет передать API key и заголовки, но не сможет сам сходить в auth-сервис, получить временный токен и подставить его в запрос. В этой статье я рассказываю о своем опыте решения этой проблемы на продакшен уровне.

    habr.com/ru/articles/1025168/

    #llm #litellm #fastapi #proxy #proxyserver #langfuse

  31. @CrabbyIT I'm currently in a similar situation. I don't have a solution yet but I'm investigating #LiteLLM as a gateway. That should give me audit logs, budgets and a place to filter prompts. What I'm still looking for is some kind of sandboxing for coding agents. They are quite lacking in this respect.

  32. @CrabbyIT I'm currently in a similar situation. I don't have a solution yet but I'm investigating #LiteLLM as a gateway. That should give me audit logs, budgets and a place to filter prompts. What I'm still looking for is some kind of sandboxing for coding agents. They are quite lacking in this respect.

  33. @CrabbyIT I'm currently in a similar situation. I don't have a solution yet but I'm investigating #LiteLLM as a gateway. That should give me audit logs, budgets and a place to filter prompts. What I'm still looking for is some kind of sandboxing for coding agents. They are quite lacking in this respect.

  34. @CrabbyIT I'm currently in a similar situation. I don't have a solution yet but I'm investigating #LiteLLM as a gateway. That should give me audit logs, budgets and a place to filter prompts. What I'm still looking for is some kind of sandboxing for coding agents. They are quite lacking in this respect.

  35. @CrabbyIT I'm currently in a similar situation. I don't have a solution yet but I'm investigating #LiteLLM as a gateway. That should give me audit logs, budgets and a place to filter prompts. What I'm still looking for is some kind of sandboxing for coding agents. They are quite lacking in this respect.