home.social

#llmops — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #llmops, aggregated by home.social.

  1. Не надо встраивать ИИ в каждую корпоративную систему, это архитектурная ошибка

    Главная мысль этой статьи простая: не надо встраивать ИИ в каждую корпоративную систему как отдельный самостоятельный AI-контур. Пользователь должен видеть ИИ там, где работает: в CRM, СЭД, ITSM, мониторинге, портале или корпоративном чате. Но модели, GPU, gateway, лимиты, аудит, политики доступа, RAG, журналы и ответственность должны жить в отдельном корпоративном слое. ИИ должен быть доступен из каждой корпоративной системы, но не должен принадлежать ни одной из них. Как бухгалтер работает и в 1С, и в почте, и на корпоративном портале, так и корпоративный ИИ должен уметь работать с разными системами, не превращаясь в модуль одной из них. Это статья про архитектурную ошибку, которую мы почти совершили в Monq, про зоопарк корпоративных копилотов, теневой ИИ, GPU-инфраструктуру, AI Gateway, безопасность, аудит и новый слой между людьми и информационными системами.

    habr.com/ru/companies/monq/art

    #LLM #платформа #llmops #ai #aiагенты #open_source #opensource #monq #unica #ии

  2. Не надо встраивать ИИ в каждую корпоративную систему, это архитектурная ошибка

    Главная мысль этой статьи простая: не надо встраивать ИИ в каждую корпоративную систему как отдельный самостоятельный AI-контур. Пользователь должен видеть ИИ там, где работает: в CRM, СЭД, ITSM, мониторинге, портале или корпоративном чате. Но модели, GPU, gateway, лимиты, аудит, политики доступа, RAG, журналы и ответственность должны жить в отдельном корпоративном слое. ИИ должен быть доступен из каждой корпоративной системы, но не должен принадлежать ни одной из них. Как бухгалтер работает и в 1С, и в почте, и на корпоративном портале, так и корпоративный ИИ должен уметь работать с разными системами, не превращаясь в модуль одной из них. Это статья про архитектурную ошибку, которую мы почти совершили в Monq, про зоопарк корпоративных копилотов, теневой ИИ, GPU-инфраструктуру, AI Gateway, безопасность, аудит и новый слой между людьми и информационными системами.

    habr.com/ru/companies/monq/art

    #LLM #платформа #llmops #ai #aiагенты #open_source #opensource #monq #unica #ии

  3. Не надо встраивать ИИ в каждую корпоративную систему, это архитектурная ошибка

    Главная мысль этой статьи простая: не надо встраивать ИИ в каждую корпоративную систему как отдельный самостоятельный AI-контур. Пользователь должен видеть ИИ там, где работает: в CRM, СЭД, ITSM, мониторинге, портале или корпоративном чате. Но модели, GPU, gateway, лимиты, аудит, политики доступа, RAG, журналы и ответственность должны жить в отдельном корпоративном слое. ИИ должен быть доступен из каждой корпоративной системы, но не должен принадлежать ни одной из них. Как бухгалтер работает и в 1С, и в почте, и на корпоративном портале, так и корпоративный ИИ должен уметь работать с разными системами, не превращаясь в модуль одной из них. Это статья про архитектурную ошибку, которую мы почти совершили в Monq, про зоопарк корпоративных копилотов, теневой ИИ, GPU-инфраструктуру, AI Gateway, безопасность, аудит и новый слой между людьми и информационными системами.

    habr.com/ru/companies/monq/art

    #LLM #платформа #llmops #ai #aiагенты #open_source #opensource #monq #unica #ии

  4. Не надо встраивать ИИ в каждую корпоративную систему, это архитектурная ошибка

    Главная мысль этой статьи простая: не надо встраивать ИИ в каждую корпоративную систему как отдельный самостоятельный AI-контур. Пользователь должен видеть ИИ там, где работает: в CRM, СЭД, ITSM, мониторинге, портале или корпоративном чате. Но модели, GPU, gateway, лимиты, аудит, политики доступа, RAG, журналы и ответственность должны жить в отдельном корпоративном слое. ИИ должен быть доступен из каждой корпоративной системы, но не должен принадлежать ни одной из них. Как бухгалтер работает и в 1С, и в почте, и на корпоративном портале, так и корпоративный ИИ должен уметь работать с разными системами, не превращаясь в модуль одной из них. Это статья про архитектурную ошибку, которую мы почти совершили в Monq, про зоопарк корпоративных копилотов, теневой ИИ, GPU-инфраструктуру, AI Gateway, безопасность, аудит и новый слой между людьми и информационными системами.

    habr.com/ru/companies/monq/art

    #LLM #платформа #llmops #ai #aiагенты #open_source #opensource #monq #unica #ии

  5. Self-Hosted Observability for Large Language Models Emerges

    Developers can now watch their LLM work locally using self-hosted Langfuse. This gives more control over data and insights. Learn how it works.

    #LLMOps, #Langfuse, #vLLM, #OpenSource, #AI

    newsletter.tf/self-hosted-llm-

  6. Self-Hosted Observability for Large Language Models Emerges

    Developers can now watch their LLM work locally using self-hosted Langfuse. This gives more control over data and insights. Learn how it works.

    #LLMOps, #Langfuse, #vLLM, #OpenSource, #AI

    newsletter.tf/self-hosted-llm-

  7. Self-Hosted Observability for Large Language Models Emerges

    Developers can now watch their LLM work locally using self-hosted Langfuse. This gives more control over data and insights. Learn how it works.

    #LLMOps, #Langfuse, #vLLM, #OpenSource, #AI

    newsletter.tf/self-hosted-llm-

  8. Self-Hosted Observability for Large Language Models Emerges

    Developers can now watch their LLM work locally using self-hosted Langfuse. This gives more control over data and insights. Learn how it works.

    #LLMOps, #Langfuse, #vLLM, #OpenSource, #AI

    newsletter.tf/self-hosted-llm-

  9. Self-Hosted Observability for Large Language Models Emerges

    Developers can now watch their LLM work locally using self-hosted Langfuse. This gives more control over data and insights. Learn how it works.

    #LLMOps, #Langfuse, #vLLM, #OpenSource, #AI

    newsletter.tf/self-hosted-llm-

  10. Running your Large Language Models locally with Langfuse is now easier. This new method gives developers more control over their data compared to cloud services.

    #LLMOps, #Langfuse, #vLLM, #OpenSource, #AI
    newsletter.tf/self-hosted-llm-

  11. Running your Large Language Models locally with Langfuse is now easier. This new method gives developers more control over their data compared to cloud services.

    #LLMOps, #Langfuse, #vLLM, #OpenSource, #AI
    newsletter.tf/self-hosted-llm-

  12. Running your Large Language Models locally with Langfuse is now easier. This new method gives developers more control over their data compared to cloud services.

    #LLMOps, #Langfuse, #vLLM, #OpenSource, #AI
    newsletter.tf/self-hosted-llm-

  13. Running your Large Language Models locally with Langfuse is now easier. This new method gives developers more control over their data compared to cloud services.

    #LLMOps, #Langfuse, #vLLM, #OpenSource, #AI
    newsletter.tf/self-hosted-llm-

  14. Running your Large Language Models locally with Langfuse is now easier. This new method gives developers more control over their data compared to cloud services.

    #LLMOps, #Langfuse, #vLLM, #OpenSource, #AI
    newsletter.tf/self-hosted-llm-

  15. Shipping an LLM agent without knowing if it breaks on edge cases is a gamble. LangWatch lets you simulate thousands of conversations, version prompts, and catch regressions before they hit production. Open-source, self-hostable, and built for real agentic pipelines. What's in the stack? Next tweet. #LLMOps

  16. : , or Large Language Model Operations, is a set of practices and tools that speed up the development, deployment, and management of AI models.

    It's a subset of Machine Learning Operations () tools that focuses on large language models (LLMs) and their unique challenges.

    knowledgezone.co.in/trends/bro

  17. #ITByte: #LLMOps, or Large Language Model Operations, is a set of practices and tools that speed up the development, deployment, and management of AI models.

    It's a subset of Machine Learning Operations (#MLOps) tools that focuses on large language models (LLMs) and their unique challenges.

    knowledgezone.co.in/trends/bro

  18. #ITByte: #LLMOps, or Large Language Model Operations, is a set of practices and tools that speed up the development, deployment, and management of AI models.

    It's a subset of Machine Learning Operations (#MLOps) tools that focuses on large language models (LLMs) and their unique challenges.

    knowledgezone.co.in/trends/bro

  19. #ITByte: #LLMOps, or Large Language Model Operations, is a set of practices and tools that speed up the development, deployment, and management of AI models.

    It's a subset of Machine Learning Operations (#MLOps) tools that focuses on large language models (LLMs) and their unique challenges.

    knowledgezone.co.in/trends/bro

  20. #ITByte: #LLMOps, or Large Language Model Operations, is a set of practices and tools that speed up the development, deployment, and management of AI models.

    It's a subset of Machine Learning Operations (#MLOps) tools that focuses on large language models (LLMs) and their unique challenges.

    knowledgezone.co.in/trends/bro

  21. Only 15% of GenAI deployments monitor LLM token costs, according to Gartner. The rest track spending through monthly provider dashboards while production chatbots burn through hundreds of millions of tokens daily. A customer support bot handling 10,000 conversations consumes 400 million tokens before lunch, creating massive telemetry overhead that can triple monitoring bills.

    #LLMOps #AIInfrastructure #GenAI

    implicator.ai/the-best-llm-tok

  22. Only 15% of GenAI deployments monitor LLM token costs, according to Gartner. The rest track spending through monthly provider dashboards while production chatbots burn through hundreds of millions of tokens daily. A customer support bot handling 10,000 conversations consumes 400 million tokens before lunch, creating massive telemetry overhead that can triple monitoring bills.

    #LLMOps #AIInfrastructure #GenAI

    implicator.ai/the-best-llm-tok

  23. Agenta - Open-source LLMOps platform

    Cossmology Profile: dub.sh/s00LukP

    Key People: Mahmoud Mabrouk, Akrem Abayed

    #LLMOps #OpenSource #OSS #COSS

  24. Avoiding the docs slide into staleness takes some proactive effort. But a lot of that can be automated these days.

    I talk about some suggestions in a blog post here: djw.fyi/portfolio/preventing-d

    #WriteTheDocs #docs #TechnicalWriting #DocOps #LLMOps

  25. Avoiding the docs slide into staleness takes some proactive effort. But a lot of that can be automated these days.

    I talk about some suggestions in a blog post here: djw.fyi/portfolio/preventing-d

    #WriteTheDocs #docs #TechnicalWriting #DocOps #LLMOps

  26. Avoiding the docs slide into staleness takes some proactive effort. But a lot of that can be automated these days.

    I talk about some suggestions in a blog post here: djw.fyi/portfolio/preventing-d

    #WriteTheDocs #docs #TechnicalWriting #DocOps #LLMOps

  27. Avoiding the docs slide into staleness takes some proactive effort. But a lot of that can be automated these days.

    I talk about some suggestions in a blog post here: djw.fyi/portfolio/preventing-d

    #WriteTheDocs #docs #TechnicalWriting #DocOps #LLMOps

  28. Avoiding the docs slide into staleness takes some proactive effort. But a lot of that can be automated these days.

    I talk about some suggestions in a blog post here: djw.fyi/portfolio/preventing-d

    #WriteTheDocs #docs #TechnicalWriting #DocOps #LLMOps

  29. NVIDIA's GPU VRAM limits hit? AllSafeUs explores augmenting with system RAM/NVMe. At EnergenAI, TIAMAT runs 120B models with 20M tokens/day on edge clusters. We optimize memory routing across 52 tools—no synthetic VRAM needed. Real efficiency > hacks. #AIInfra #LLMOps #EdgeAI tiamat.live

  30. NVIDIA's GPU VRAM limits hit? AllSafeUs explores augmenting with system RAM/NVMe. At EnergenAI, TIAMAT runs 120B models with 20M tokens/day on edge clusters. We optimize memory routing across 52 tools—no synthetic VRAM needed. Real efficiency > hacks. #AIInfra #LLMOps #EdgeAI tiamat.live

  31. 🎙️ Builders. Practitioners. Researchers. Thought leaders. If you're shaping the future of AI, Observe 26 wants YOU on stage.

    We're looking for voices working on LLM evaluation, AI agents, observability, and shipping AI to production.

    Observe 2026 | June 4 | Shack15, San Francisco

    Apply to speak 👇
    docs.google.com/forms/d/e/1FAI

  32. In MLOps, you monitored model drift.
    In the Agent Era you monitor decisions.
    An agent reasons, calls tools & retrieves context across multiple steps. Any step can fail silently.
    Your old MLOps playbook didn't break. The problem just changed shape.
    #AIObservability #LLMOps #MLOps

  33. 3 Steps to Distill LLMs: Shrink Your Model and Save Money Chinese AI labs like DeepSeek and Moonshot didn’t invent distillation, but they showed the world what it can do. They built models that...

    #llm #llmops #mlops #distillation #machine-learning

    Origin | Interest | Match
  34. We’re excited to share that pgEdge is now a Silver Member of the Agentic AI Foundation!

    Joining this forward-thinking community reinforces our commitment to advancing responsible, open, and collaborative standards in agentic AI. Together with innovators across the industry, we’re helping shape the future of AI that’s safe, transparent, and impactful.

    Read more in the press release aaif.io/press/agentic-ai-found

    #AgenticAI #OpenSourceAI #AIEngineering #AI #LLM #AIOps #LLMOps #ML #DevCommunity #Dev

  35. We’re excited to share that pgEdge is now a Silver Member of the Agentic AI Foundation!

    Joining this forward-thinking community reinforces our commitment to advancing responsible, open, and collaborative standards in agentic AI. Together with innovators across the industry, we’re helping shape the future of AI that’s safe, transparent, and impactful.

    Read more in the press release aaif.io/press/agentic-ai-found

    #AgenticAI #OpenSourceAI #AIEngineering #AI #LLM #AIOps #LLMOps #ML #DevCommunity #Dev