#rag — Public Fediverse posts
Live and recent posts from across the Fediverse tagged #rag, aggregated by home.social.
-
HR-бот на базе RAG: архитектура корпоративной базы знаний для ресторанного холдинга
В ресторанном холдинге была внедрена система HR-бота на базе ИИ, которая работает поверх корпоративной базы знаний, учитывает роль сотрудника и предоставляет ответы со ссылками на актуальные документы. Основная задача проекта — заменить разрозненные FAQ, Wiki, документы и чаты единым интерфейсом доступа к корпоративным знаниям. Сотрудник может задать вопрос в свободной форме и получить ответ с учётом своей должности, прав доступа и актуальной версии документа.
https://habr.com/ru/articles/1040000/
#rag #hr_tech #корпоративная_база_знаний #aiбот #llm #postgresql #notion #rolebased_access_control #knowledge_management #ai_automation
-
Интеграция LLM в корпоративные приложения
Интеграция LLM повышает эффективность, автоматизирует рабочие процессы и улучшает качество принимаемых решений, но успех зависит от стратегии, исполнения и соответствия бизнес-целям.
До недавнего времени многие рассматривали большие языковые модели (БЛМ) в основном как игрушки...
#DST #DSTGlobal #ДСТ #ДСТГлобал #Интеграция #LLM #корпоративныеприложения #искусственныйинтеллект #RAG #языковыемодели
Источник: https://dstglobal.ru/club/1237-integracija-llm-v-korporativnye-prilozhenija
-
"Retrieval-Augmented Generation – Ein Erfahrungsbericht und Leitfaden zum Einsatz von wissensbasierten Chatbots an der HU Berlin"
Teil 1: https://doi.org/10.1515/iwp-2026-3007
Teil 2: https://doi.org/10.1515/iwp-2026-3008
#Bibliothek #Chatbot #RAG #LLMs -
Что скрывается за AI-стратегией SAP, Oracle и Palantir: зачем корпоративному ИИ семантическое ядро
SAP, Oracle, Palantir, Celonis, Alibaba и Yonyou всё активнее строят вокруг корпоративного ИИ семантические слои: knowledge graph, ontology, process intelligence, business data cloud, agent memory и агентные платформы. Зачем им это, если языковая модель уже умеет читать документы, таблицы и API? Потому что корпоративному ИИ нужен не только доступ к данным. Ему нужен смысловой слой предприятия: термины, объекты, экземпляры, статусы, источники, связи и правила качества. Именно здесь начинается переход от отдельных ИИ-функций к системам, которые способны собирать комплексную управленческую позицию для действия. Разберём, что за этим стоит?
https://habr.com/ru/articles/1039996/
#искусственный_интеллект #корпоративный_ИИ #ИИагенты #RAG #knowledge_graph #ontology #семантическое_ядро #ERP #управление_данными #архитектура_ПО
-
Что скрывается за AI-стратегией SAP, Oracle и Palantir: зачем корпоративному ИИ семантическое ядро
SAP, Oracle, Palantir, Celonis, Alibaba и Yonyou всё активнее строят вокруг корпоративного ИИ семантические слои: knowledge graph, ontology, process intelligence, business data cloud, agent memory и агентные платформы. Зачем им это, если языковая модель уже умеет читать документы, таблицы и API? Потому что корпоративному ИИ нужен не только доступ к данным. Ему нужен смысловой слой предприятия: термины, объекты, экземпляры, статусы, источники, связи и правила качества. Именно здесь начинается переход от отдельных ИИ-функций к системам, которые способны собирать комплексную управленческую позицию для действия. Разберём, что за этим стоит?
https://habr.com/ru/articles/1039996/
#искусственный_интеллект #корпоративный_ИИ #ИИагенты #RAG #knowledge_graph #ontology #семантическое_ядро #ERP #управление_данными #архитектура_ПО
-
Что скрывается за AI-стратегией SAP, Oracle и Palantir: зачем корпоративному ИИ семантическое ядро
SAP, Oracle, Palantir, Celonis, Alibaba и Yonyou всё активнее строят вокруг корпоративного ИИ семантические слои: knowledge graph, ontology, process intelligence, business data cloud, agent memory и агентные платформы. Зачем им это, если языковая модель уже умеет читать документы, таблицы и API? Потому что корпоративному ИИ нужен не только доступ к данным. Ему нужен смысловой слой предприятия: термины, объекты, экземпляры, статусы, источники, связи и правила качества. Именно здесь начинается переход от отдельных ИИ-функций к системам, которые способны собирать комплексную управленческую позицию для действия. Разберём, что за этим стоит?
https://habr.com/ru/articles/1039996/
#искусственный_интеллект #корпоративный_ИИ #ИИагенты #RAG #knowledge_graph #ontology #семантическое_ядро #ERP #управление_данными #архитектура_ПО
-
Что скрывается за AI-стратегией SAP, Oracle и Palantir: зачем корпоративному ИИ семантическое ядро
SAP, Oracle, Palantir, Celonis, Alibaba и Yonyou всё активнее строят вокруг корпоративного ИИ семантические слои: knowledge graph, ontology, process intelligence, business data cloud, agent memory и агентные платформы. Зачем им это, если языковая модель уже умеет читать документы, таблицы и API? Потому что корпоративному ИИ нужен не только доступ к данным. Ему нужен смысловой слой предприятия: термины, объекты, экземпляры, статусы, источники, связи и правила качества. Именно здесь начинается переход от отдельных ИИ-функций к системам, которые способны собирать комплексную управленческую позицию для действия. Разберём, что за этим стоит?
https://habr.com/ru/articles/1039996/
#искусственный_интеллект #корпоративный_ИИ #ИИагенты #RAG #knowledge_graph #ontology #семантическое_ядро #ERP #управление_данными #архитектура_ПО
-
Почему RAG — фундамент любой AI-трансформации
За последние годы большинство AI-проектов в компаниях стартуют одинаково: сначала делают чат-бота, затем добавляют агентов, автоматизируют отдельные процессы и ожидают роста эффективности. На практике такие проекты часто не дают устойчивого результата. Модель может корректно генерировать текст, демонстрации выглядят убедительно, но в реальной работе ответы оказываются нестабильными, противоречивыми и не связанными с внутренними стандартами компании. Основная причина — отсутствие единого слоя знаний. В проекте для ресторанной группы с 10+ заведениями и историей более 15 лет мы сознательно начали не с агентов и не с интерфейсов, а с построения корпоративной RAG-инфраструктуры. Этот слой стал основой всей последующей AI-архитектуры.
https://habr.com/ru/articles/1039986/
#rag #искусственный_интеллект #llm #retrieval_augmented_generation #векторная_база_данных #embeddings #корпоративные_данные #ai_automation #knowledge_base #hallucinations
-
Почему RAG — фундамент любой AI-трансформации
За последние годы большинство AI-проектов в компаниях стартуют одинаково: сначала делают чат-бота, затем добавляют агентов, автоматизируют отдельные процессы и ожидают роста эффективности. На практике такие проекты часто не дают устойчивого результата. Модель может корректно генерировать текст, демонстрации выглядят убедительно, но в реальной работе ответы оказываются нестабильными, противоречивыми и не связанными с внутренними стандартами компании. Основная причина — отсутствие единого слоя знаний. В проекте для ресторанной группы с 10+ заведениями и историей более 15 лет мы сознательно начали не с агентов и не с интерфейсов, а с построения корпоративной RAG-инфраструктуры. Этот слой стал основой всей последующей AI-архитектуры.
https://habr.com/ru/articles/1039986/
#rag #искусственный_интеллект #llm #retrieval_augmented_generation #векторная_база_данных #embeddings #корпоративные_данные #ai_automation #knowledge_base #hallucinations
-
Почему RAG — фундамент любой AI-трансформации
За последние годы большинство AI-проектов в компаниях стартуют одинаково: сначала делают чат-бота, затем добавляют агентов, автоматизируют отдельные процессы и ожидают роста эффективности. На практике такие проекты часто не дают устойчивого результата. Модель может корректно генерировать текст, демонстрации выглядят убедительно, но в реальной работе ответы оказываются нестабильными, противоречивыми и не связанными с внутренними стандартами компании. Основная причина — отсутствие единого слоя знаний. В проекте для ресторанной группы с 10+ заведениями и историей более 15 лет мы сознательно начали не с агентов и не с интерфейсов, а с построения корпоративной RAG-инфраструктуры. Этот слой стал основой всей последующей AI-архитектуры.
https://habr.com/ru/articles/1039986/
#rag #искусственный_интеллект #llm #retrieval_augmented_generation #векторная_база_данных #embeddings #корпоративные_данные #ai_automation #knowledge_base #hallucinations
-
Почему RAG — фундамент любой AI-трансформации
За последние годы большинство AI-проектов в компаниях стартуют одинаково: сначала делают чат-бота, затем добавляют агентов, автоматизируют отдельные процессы и ожидают роста эффективности. На практике такие проекты часто не дают устойчивого результата. Модель может корректно генерировать текст, демонстрации выглядят убедительно, но в реальной работе ответы оказываются нестабильными, противоречивыми и не связанными с внутренними стандартами компании. Основная причина — отсутствие единого слоя знаний. В проекте для ресторанной группы с 10+ заведениями и историей более 15 лет мы сознательно начали не с агентов и не с интерфейсов, а с построения корпоративной RAG-инфраструктуры. Этот слой стал основой всей последующей AI-архитектуры.
https://habr.com/ru/articles/1039986/
#rag #искусственный_интеллект #llm #retrieval_augmented_generation #векторная_база_данных #embeddings #корпоративные_данные #ai_automation #knowledge_base #hallucinations
-
Excited to be at the @dariaheu #DARIAH2026 Annual Event, presenting The #AIncientTutor! 🏛️✨ Developed at the Historisches Seminar of @uzh with Felix Maier, our project reshapes how we learn ancient languages using #LLM support. 🤖📚 By integrating #RAG with NLP pipelines like #LatinCy and #OdyCy, the system dynamically guides learners through unedited primary sources without needing prior annotations.
📜🔍 The platform modularises translation into sequential tasks (identifying clause structures, predicates, & grammatical functions).
🧠💡 All linguistic data is consolidated into a structured, fully inspectable JSON format to encourage critical engagement rather than passive acceptance.
💻📊 Planned extensions include an automated vocabulary trainer for #Anki export, adaptive difficulty, and instructor analytics dashboards.
📈🚀 Stop by the poster session to chat with me or reach out at [email protected]! 🗣️🤝 #DigitalHumanities #AIinEducation #LatinNLP #AncientGreek #EdTech #AncientLanguages #Latin
-
Excited to be at the @dariaheu #DARIAH2026 Annual Event, presenting The #AIncientTutor! 🏛️✨ Developed at the Historisches Seminar of @uzh with Felix Maier, our project reshapes how we learn ancient languages using #LLM support. 🤖📚 By integrating #RAG with NLP pipelines like #LatinCy and #OdyCy, the system dynamically guides learners through unedited primary sources without needing prior annotations.
📜🔍 The platform modularises translation into sequential tasks (identifying clause structures, predicates, & grammatical functions).
🧠💡 All linguistic data is consolidated into a structured, fully inspectable JSON format to encourage critical engagement rather than passive acceptance.
💻📊 Planned extensions include an automated vocabulary trainer for #Anki export, adaptive difficulty, and instructor analytics dashboards.
📈🚀 Stop by the poster session to chat with me or reach out at [email protected]! 🗣️🤝 #DigitalHumanities #AIinEducation #LatinNLP #AncientGreek #EdTech #AncientLanguages #Latin
-
Excited to be at the @dariaheu #DARIAH2026 Annual Event, presenting The #AIncientTutor! 🏛️✨ Developed at the Historisches Seminar of @uzh with Felix Maier, our project reshapes how we learn ancient languages using #LLM support. 🤖📚 By integrating #RAG with NLP pipelines like #LatinCy and #OdyCy, the system dynamically guides learners through unedited primary sources without needing prior annotations.
📜🔍 The platform modularises translation into sequential tasks (identifying clause structures, predicates, & grammatical functions).
🧠💡 All linguistic data is consolidated into a structured, fully inspectable JSON format to encourage critical engagement rather than passive acceptance.
💻📊 Planned extensions include an automated vocabulary trainer for #Anki export, adaptive difficulty, and instructor analytics dashboards.
📈🚀 Stop by the poster session to chat with me or reach out at [email protected]! 🗣️🤝 #DigitalHumanities #AIinEducation #LatinNLP #AncientGreek #EdTech #AncientLanguages #Latin
-
Excited to be at the @dariaheu #DARIAH2026 Annual Event, presenting The #AIncientTutor! 🏛️✨ Developed at the Historisches Seminar of @uzh with Felix Maier, our project reshapes how we learn ancient languages using #LLM support. 🤖📚 By integrating #RAG with NLP pipelines like #LatinCy and #OdyCy, the system dynamically guides learners through unedited primary sources without needing prior annotations.
📜🔍 The platform modularises translation into sequential tasks (identifying clause structures, predicates, & grammatical functions).
🧠💡 All linguistic data is consolidated into a structured, fully inspectable JSON format to encourage critical engagement rather than passive acceptance.
💻📊 Planned extensions include an automated vocabulary trainer for #Anki export, adaptive difficulty, and instructor analytics dashboards.
📈🚀 Stop by the poster session to chat with me or reach out at [email protected]! 🗣️🤝 #DigitalHumanities #AIinEducation #LatinNLP #AncientGreek #EdTech #AncientLanguages #Latin
-
Excited to be at the @dariaheu #DARIAH2026 Annual Event, presenting The #AIncientTutor! 🏛️✨ Developed at the Historisches Seminar of @uzh with Felix Maier, our project reshapes how we learn ancient languages using #LLM support. 🤖📚 By integrating #RAG with NLP pipelines like #LatinCy and #OdyCy, the system dynamically guides learners through unedited primary sources without needing prior annotations.
📜🔍 The platform modularises translation into sequential tasks (identifying clause structures, predicates, & grammatical functions).
🧠💡 All linguistic data is consolidated into a structured, fully inspectable JSON format to encourage critical engagement rather than passive acceptance.
💻📊 Planned extensions include an automated vocabulary trainer for #Anki export, adaptive difficulty, and instructor analytics dashboards.
📈🚀 Stop by the poster session to chat with me or reach out at [email protected]! 🗣️🤝 #DigitalHumanities #AIinEducation #LatinNLP #AncientGreek #EdTech #AncientLanguages #Latin
-
I like #Claude, but the lowest-cost model, #Haiku, is mostly worthless. I was talking about power supplies for a product, and it told me I get get more *power* out of a North American outlet because 20A breakers are common here, whereas in Europe and Asia 16A are more common.
I save on tokens using Haiku, but I end up spending more because the output is worse than #Gemini Flash-Lite, #llama3, or #Phi4. Haiku *may* be better at #RAG; I'm not sure, but it doesn't make up for the #LLM being bad.
-
I like #Claude, but the lowest-cost model, #Haiku, is mostly worthless. I was talking about power supplies for a product, and it told me I get get more *power* out of a North American outlet because 20A breakers are common here, whereas in Europe and Asia 16A are more common.
I save on tokens using Haiku, but I end up spending more because the output is worse than #Gemini Flash-Lite, #llama3, or #Phi4. Haiku *may* be better at #RAG; I'm not sure, but it doesn't make up for the #LLM being bad.
-
I like #Claude, but the lowest-cost model, #Haiku, is mostly worthless. I was talking about power supplies for a product, and it told me I get get more *power* out of a North American outlet because 20A breakers are common here, whereas in Europe and Asia 16A are more common.
I save on tokens using Haiku, but I end up spending more because the output is worse than #Gemini Flash-Lite, #llama3, or #Phi4. Haiku *may* be better at #RAG; I'm not sure, but it doesn't make up for the #LLM being bad.
-
I like #Claude, but the lowest-cost model, #Haiku, is mostly worthless. I was talking about power supplies for a product, and it told me I get get more *power* out of a North American outlet because 20A breakers are common here, whereas in Europe and Asia 16A are more common.
I save on tokens using Haiku, but I end up spending more because the output is worse than #Gemini Flash-Lite, #llama3, or #Phi4. Haiku *may* be better at #RAG; I'm not sure, but it doesn't make up for the #LLM being bad.
-
I like #Claude, but the lowest-cost model, #Haiku, is mostly worthless. I was talking about power supplies for a product, and it told me I get get more *power* out of a North American outlet because 20A breakers are common here, whereas in Europe and Asia 16A are more common.
I save on tokens using Haiku, but I end up spending more because the output is worse than #Gemini Flash-Lite, #llama3, or #Phi4. Haiku *may* be better at #RAG; I'm not sure, but it doesn't make up for the #LLM being bad.
-
Память на миллион, а толку ноль: как мы спасали ИИ-агента от «тупости»
На связи Сергей Смирнов, AI-инженер и основатель LLMStart.ru. Сегодня разбираем горячую тему, на которой спотыкаются многие разработчики ботов — память нейросетей. У всех современных топовых моделей появились гигантские окна контекста — от миллиона токенов. Кажется, что теперь туда можно просто закинуть всю историю переписки, все корпоративные методички, и агент сам во всём разберётся или не разберётся?.. В статье разбираем реальный кейс — как мы управляем памятью ИИ-агента, чтобы он отвечал быстро, точно и не сжигал бюджет на токены впустую. Внутри — наглядные графики, три механизма очистки памяти и хитрый инженерный трюк с изолированным субагентом-аудитором.
https://habr.com/ru/companies/llmstart/articles/1038506/
#LangChain #ИИагенты #RAG #context_engineering #LLM #AIdriven_разработка #llmstart #контекстинжиниринг #production #productionready
-
Память на миллион, а толку ноль: как мы спасали ИИ-агента от «тупости»
На связи Сергей Смирнов, AI-инженер и основатель LLMStart.ru. Сегодня разбираем горячую тему, на которой спотыкаются многие разработчики ботов — память нейросетей. У всех современных топовых моделей появились гигантские окна контекста — от миллиона токенов. Кажется, что теперь туда можно просто закинуть всю историю переписки, все корпоративные методички, и агент сам во всём разберётся или не разберётся?.. В статье разбираем реальный кейс — как мы управляем памятью ИИ-агента, чтобы он отвечал быстро, точно и не сжигал бюджет на токены впустую. Внутри — наглядные графики, три механизма очистки памяти и хитрый инженерный трюк с изолированным субагентом-аудитором.
https://habr.com/ru/companies/llmstart/articles/1038506/
#LangChain #ИИагенты #RAG #context_engineering #LLM #AIdriven_разработка #llmstart #контекстинжиниринг #production #productionready
-
Память на миллион, а толку ноль: как мы спасали ИИ-агента от «тупости»
На связи Сергей Смирнов, AI-инженер и основатель LLMStart.ru. Сегодня разбираем горячую тему, на которой спотыкаются многие разработчики ботов — память нейросетей. У всех современных топовых моделей появились гигантские окна контекста — от миллиона токенов. Кажется, что теперь туда можно просто закинуть всю историю переписки, все корпоративные методички, и агент сам во всём разберётся или не разберётся?.. В статье разбираем реальный кейс — как мы управляем памятью ИИ-агента, чтобы он отвечал быстро, точно и не сжигал бюджет на токены впустую. Внутри — наглядные графики, три механизма очистки памяти и хитрый инженерный трюк с изолированным субагентом-аудитором.
https://habr.com/ru/companies/llmstart/articles/1038506/
#LangChain #ИИагенты #RAG #context_engineering #LLM #AIdriven_разработка #llmstart #контекстинжиниринг #production #productionready
-
Память на миллион, а толку ноль: как мы спасали ИИ-агента от «тупости»
На связи Сергей Смирнов, AI-инженер и основатель LLMStart.ru. Сегодня разбираем горячую тему, на которой спотыкаются многие разработчики ботов — память нейросетей. У всех современных топовых моделей появились гигантские окна контекста — от миллиона токенов. Кажется, что теперь туда можно просто закинуть всю историю переписки, все корпоративные методички, и агент сам во всём разберётся или не разберётся?.. В статье разбираем реальный кейс — как мы управляем памятью ИИ-агента, чтобы он отвечал быстро, точно и не сжигал бюджет на токены впустую. Внутри — наглядные графики, три механизма очистки памяти и хитрый инженерный трюк с изолированным субагентом-аудитором.
https://habr.com/ru/companies/llmstart/articles/1038506/
#LangChain #ИИагенты #RAG #context_engineering #LLM #AIdriven_разработка #llmstart #контекстинжиниринг #production #productionready
-
I'm seeing many people are into using #AI / #LLM but they stick to web/mobile chat app. Maybe looking into images fun. Interesting is that they don't dive into deeper parts: #agenticAI , #rag , etc.
Maybe this is due to high entry line, nonetheless I'm finding that interesting.
-
I'm seeing many people are into using #AI / #LLM but they stick to web/mobile chat app. Maybe looking into images fun. Interesting is that they don't dive into deeper parts: #agenticAI , #rag , etc.
Maybe this is due to high entry line, nonetheless I'm finding that interesting.
-
I'm seeing many people are into using #AI / #LLM but they stick to web/mobile chat app. Maybe looking into images fun. Interesting is that they don't dive into deeper parts: #agenticAI , #rag , etc.
Maybe this is due to high entry line, nonetheless I'm finding that interesting.
-
I'm seeing many people are into using #AI / #LLM but they stick to web/mobile chat app. Maybe looking into images fun. Interesting is that they don't dive into deeper parts: #agenticAI , #rag , etc.
Maybe this is due to high entry line, nonetheless I'm finding that interesting.
-
I'm seeing many people are into using #AI / #LLM but they stick to web/mobile chat app. Maybe looking into images fun. Interesting is that they don't dive into deeper parts: #agenticAI , #rag , etc.
Maybe this is due to high entry line, nonetheless I'm finding that interesting.
-
RAG без downtime: настраиваем инкрементальное обновление документов на Qdrant и LangChain
PM: Нам нужно актуализировать базу знаний для ИИ-ассистента, там изменилась инструкция по смене пароля. DevOps: Не проблема, сейчас запущу скрипт, через два часа всё обновится. Предупреди Заказчика о недоступности сервиса. Знакомая ситуация? Полная зачистка векторной базы и реиндексация всех имеющихся документов с остановкой сервиса - решение простое и надёжное, но «прощается» только на этапе прототипа. В продакшене могут быть сотни тысяч документов, живые пользователи и SLA с требованием по доступности сервиса. Обновилась одна, пусть и очень важная инструкция, и сервис недоступен два часа. А если таких обновлений десятки в неделю? Давайте исправим это и напишем ETL-скрипт , который умеет добавлять, обновлять и удалять отдельные документы без остановки сервиса.
https://habr.com/ru/articles/1038456/
#rag #etlпайплайн #qdrant #qdrant_vector_store #масштабирование #airflow #python #rag_система
-
RAG без downtime: настраиваем инкрементальное обновление документов на Qdrant и LangChain
PM: Нам нужно актуализировать базу знаний для ИИ-ассистента, там изменилась инструкция по смене пароля. DevOps: Не проблема, сейчас запущу скрипт, через два часа всё обновится. Предупреди Заказчика о недоступности сервиса. Знакомая ситуация? Полная зачистка векторной базы и реиндексация всех имеющихся документов с остановкой сервиса - решение простое и надёжное, но «прощается» только на этапе прототипа. В продакшене могут быть сотни тысяч документов, живые пользователи и SLA с требованием по доступности сервиса. Обновилась одна, пусть и очень важная инструкция, и сервис недоступен два часа. А если таких обновлений десятки в неделю? Давайте исправим это и напишем ETL-скрипт , который умеет добавлять, обновлять и удалять отдельные документы без остановки сервиса.
https://habr.com/ru/articles/1038456/
#rag #etlпайплайн #qdrant #qdrant_vector_store #масштабирование #airflow #python #rag_система
-
RAG без downtime: настраиваем инкрементальное обновление документов на Qdrant и LangChain
PM: Нам нужно актуализировать базу знаний для ИИ-ассистента, там изменилась инструкция по смене пароля. DevOps: Не проблема, сейчас запущу скрипт, через два часа всё обновится. Предупреди Заказчика о недоступности сервиса. Знакомая ситуация? Полная зачистка векторной базы и реиндексация всех имеющихся документов с остановкой сервиса - решение простое и надёжное, но «прощается» только на этапе прототипа. В продакшене могут быть сотни тысяч документов, живые пользователи и SLA с требованием по доступности сервиса. Обновилась одна, пусть и очень важная инструкция, и сервис недоступен два часа. А если таких обновлений десятки в неделю? Давайте исправим это и напишем ETL-скрипт , который умеет добавлять, обновлять и удалять отдельные документы без остановки сервиса.
https://habr.com/ru/articles/1038456/
#rag #etlпайплайн #qdrant #qdrant_vector_store #масштабирование #airflow #python #rag_система
-
RAG без downtime: настраиваем инкрементальное обновление документов на Qdrant и LangChain
PM: Нам нужно актуализировать базу знаний для ИИ-ассистента, там изменилась инструкция по смене пароля. DevOps: Не проблема, сейчас запущу скрипт, через два часа всё обновится. Предупреди Заказчика о недоступности сервиса. Знакомая ситуация? Полная зачистка векторной базы и реиндексация всех имеющихся документов с остановкой сервиса - решение простое и надёжное, но «прощается» только на этапе прототипа. В продакшене могут быть сотни тысяч документов, живые пользователи и SLA с требованием по доступности сервиса. Обновилась одна, пусть и очень важная инструкция, и сервис недоступен два часа. А если таких обновлений десятки в неделю? Давайте исправим это и напишем ETL-скрипт , который умеет добавлять, обновлять и удалять отдельные документы без остановки сервиса.
https://habr.com/ru/articles/1038456/
#rag #etlпайплайн #qdrant #qdrant_vector_store #масштабирование #airflow #python #rag_система
-
Почему ломается ваш AI-агент — и почему смена модели обычно его не чинит
Представьте внутреннего AI-агента, который помогает компании искать общие документы и управлять ими. Он работает. До тех пор, пока 12–15% запросов не начинают падать. Агент возвращает не тот документ, редактирует не тот файл, молча падает или уверенно ссылается на файл, которого не существует. Поиск по фото отказывает с той же частотой. Ошибки размазаны равномерно по пользователям, фичам и запросам. Первое инстинктивное действие — поменять модель. Opus 4.5, GPT 5.5 или что там сейчас в топе лидерборда. Меняете. Счет за инференс растет в 4–5 раз, а общая доля ошибок снижается с 12% до 9%. Пользователи пишут о тех же проблемах. Бюджет следующего квартала сгорает за пару недель ради улучшения в 3 процентных пункта — и вы по-прежнему не понимаете, что именно было не так в системе и как улучшать ее дальше. Эта статья — о том, почему смена модели обычно разочаровывает и куда стоит смотреть в первую очередь. Большинство сбоев AI-систем живет в слое обвязки — orchestration, retrieval, tool definitions, retries, context management, — а не в самой модели. Дальше — метод, как отличить проблемы обвязки от проблем модели, кейс, в котором одно исправление в обвязке подняло completion rate с 26% до 88% без смены модели, и чек-лист, который помогает находить такие сбои в вашей собственной системе. Если вы никогда не делали подобной диагностики — ожидайте найти хотя бы один пункт, который стоит починить.
https://habr.com/ru/articles/1039292/
#aiагенты #llm #rag #orchestration #retrieval #tool_calling #context_engineering #evals #production #ai_infrastructure
-
Почему ломается ваш AI-агент — и почему смена модели обычно его не чинит
Представьте внутреннего AI-агента, который помогает компании искать общие документы и управлять ими. Он работает. До тех пор, пока 12–15% запросов не начинают падать. Агент возвращает не тот документ, редактирует не тот файл, молча падает или уверенно ссылается на файл, которого не существует. Поиск по фото отказывает с той же частотой. Ошибки размазаны равномерно по пользователям, фичам и запросам. Первое инстинктивное действие — поменять модель. Opus 4.5, GPT 5.5 или что там сейчас в топе лидерборда. Меняете. Счет за инференс растет в 4–5 раз, а общая доля ошибок снижается с 12% до 9%. Пользователи пишут о тех же проблемах. Бюджет следующего квартала сгорает за пару недель ради улучшения в 3 процентных пункта — и вы по-прежнему не понимаете, что именно было не так в системе и как улучшать ее дальше. Эта статья — о том, почему смена модели обычно разочаровывает и куда стоит смотреть в первую очередь. Большинство сбоев AI-систем живет в слое обвязки — orchestration, retrieval, tool definitions, retries, context management, — а не в самой модели. Дальше — метод, как отличить проблемы обвязки от проблем модели, кейс, в котором одно исправление в обвязке подняло completion rate с 26% до 88% без смены модели, и чек-лист, который помогает находить такие сбои в вашей собственной системе. Если вы никогда не делали подобной диагностики — ожидайте найти хотя бы один пункт, который стоит починить.
https://habr.com/ru/articles/1039292/
#aiагенты #llm #rag #orchestration #retrieval #tool_calling #context_engineering #evals #production #ai_infrastructure
-
Почему ломается ваш AI-агент — и почему смена модели обычно его не чинит
Представьте внутреннего AI-агента, который помогает компании искать общие документы и управлять ими. Он работает. До тех пор, пока 12–15% запросов не начинают падать. Агент возвращает не тот документ, редактирует не тот файл, молча падает или уверенно ссылается на файл, которого не существует. Поиск по фото отказывает с той же частотой. Ошибки размазаны равномерно по пользователям, фичам и запросам. Первое инстинктивное действие — поменять модель. Opus 4.5, GPT 5.5 или что там сейчас в топе лидерборда. Меняете. Счет за инференс растет в 4–5 раз, а общая доля ошибок снижается с 12% до 9%. Пользователи пишут о тех же проблемах. Бюджет следующего квартала сгорает за пару недель ради улучшения в 3 процентных пункта — и вы по-прежнему не понимаете, что именно было не так в системе и как улучшать ее дальше. Эта статья — о том, почему смена модели обычно разочаровывает и куда стоит смотреть в первую очередь. Большинство сбоев AI-систем живет в слое обвязки — orchestration, retrieval, tool definitions, retries, context management, — а не в самой модели. Дальше — метод, как отличить проблемы обвязки от проблем модели, кейс, в котором одно исправление в обвязке подняло completion rate с 26% до 88% без смены модели, и чек-лист, который помогает находить такие сбои в вашей собственной системе. Если вы никогда не делали подобной диагностики — ожидайте найти хотя бы один пункт, который стоит починить.
https://habr.com/ru/articles/1039292/
#aiагенты #llm #rag #orchestration #retrieval #tool_calling #context_engineering #evals #production #ai_infrastructure
-
Почему ломается ваш AI-агент — и почему смена модели обычно его не чинит
Представьте внутреннего AI-агента, который помогает компании искать общие документы и управлять ими. Он работает. До тех пор, пока 12–15% запросов не начинают падать. Агент возвращает не тот документ, редактирует не тот файл, молча падает или уверенно ссылается на файл, которого не существует. Поиск по фото отказывает с той же частотой. Ошибки размазаны равномерно по пользователям, фичам и запросам. Первое инстинктивное действие — поменять модель. Opus 4.5, GPT 5.5 или что там сейчас в топе лидерборда. Меняете. Счет за инференс растет в 4–5 раз, а общая доля ошибок снижается с 12% до 9%. Пользователи пишут о тех же проблемах. Бюджет следующего квартала сгорает за пару недель ради улучшения в 3 процентных пункта — и вы по-прежнему не понимаете, что именно было не так в системе и как улучшать ее дальше. Эта статья — о том, почему смена модели обычно разочаровывает и куда стоит смотреть в первую очередь. Большинство сбоев AI-систем живет в слое обвязки — orchestration, retrieval, tool definitions, retries, context management, — а не в самой модели. Дальше — метод, как отличить проблемы обвязки от проблем модели, кейс, в котором одно исправление в обвязке подняло completion rate с 26% до 88% без смены модели, и чек-лист, который помогает находить такие сбои в вашей собственной системе. Если вы никогда не делали подобной диагностики — ожидайте найти хотя бы один пункт, который стоит починить.
https://habr.com/ru/articles/1039292/
#aiагенты #llm #rag #orchestration #retrieval #tool_calling #context_engineering #evals #production #ai_infrastructure
-
AnythingLLM in locale: guida pratica passo passo
https://www.risposteinformatiche.it/anythingllm-in-locale-guida-pratica-passo-passo/ -
AnythingLLM in locale: guida pratica passo passo
https://www.risposteinformatiche.it/anythingllm-in-locale-guida-pratica-passo-passo/ -
AnythingLLM in locale: guida pratica passo passo
https://www.risposteinformatiche.it/anythingllm-in-locale-guida-pratica-passo-passo/ -
AnythingLLM in locale: guida pratica passo passo
https://www.risposteinformatiche.it/anythingllm-in-locale-guida-pratica-passo-passo/ -
AnythingLLM in locale: guida pratica passo passo
https://www.risposteinformatiche.it/anythingllm-in-locale-guida-pratica-passo-passo/ -
صباح الابداع! 🌞
IBM أطلق دليل “RAG Cookbook: دليل إلى التخزين والاسترجاع”، يُمكّن المطورين من دمج تخزين ومنصات الاسترجاع مع نماذج الذكاء الاصطناعي.
🔑 نقطة رئيسية: RAG يضيف سياقًا خارجيًا، ما يزيد دقة وتنوع المحتوى المُولَّد.
مفيد للمهتمين بالذكاء الاصطناعي الموزَّع وحماية البيانات.- إعداد بنية تخزين مرنة
- استراتيجيات استرجاع فعّالة
- تكامل سلس مع LLMs -
🧠 What is RAG (Retrieval-Augmented Generation) and why it matters in 2026:
RAG = LLM + Your Own Data
Instead of retraining models, you inject relevant context at query time. Result? Accurate, grounded AI that doesn't hallucinate.
I've built RAG systems for production at scale. Key lessons:
✔️ Chunk strategy matters more than the model
✔️ Embedding quality = retrieval quality
✔️ Reranking is underratedAsk me anything 👇
#RAG #LLM #AI #GenerativeAI #MachineLearning #WebDev #FullStack
-
🧠 What is RAG (Retrieval-Augmented Generation) and why it matters in 2026:
RAG = LLM + Your Own Data
Instead of retraining models, you inject relevant context at query time. Result? Accurate, grounded AI that doesn't hallucinate.
I've built RAG systems for production at scale. Key lessons:
✔️ Chunk strategy matters more than the model
✔️ Embedding quality = retrieval quality
✔️ Reranking is underratedAsk me anything 👇
#RAG #LLM #AI #GenerativeAI #MachineLearning #WebDev #FullStack
-
🧠 What is RAG (Retrieval-Augmented Generation) and why it matters in 2026:
RAG = LLM + Your Own Data
Instead of retraining models, you inject relevant context at query time. Result? Accurate, grounded AI that doesn't hallucinate.
I've built RAG systems for production at scale. Key lessons:
✔️ Chunk strategy matters more than the model
✔️ Embedding quality = retrieval quality
✔️ Reranking is underratedAsk me anything 👇
#RAG #LLM #AI #GenerativeAI #MachineLearning #WebDev #FullStack
-
🧠 What is RAG (Retrieval-Augmented Generation) and why it matters in 2026:
RAG = LLM + Your Own Data
Instead of retraining models, you inject relevant context at query time. Result? Accurate, grounded AI that doesn't hallucinate.
I've built RAG systems for production at scale. Key lessons:
✔️ Chunk strategy matters more than the model
✔️ Embedding quality = retrieval quality
✔️ Reranking is underratedAsk me anything 👇
#RAG #LLM #AI #GenerativeAI #MachineLearning #WebDev #FullStack
-
🧠 What is RAG (Retrieval-Augmented Generation) and why it matters in 2026:
RAG = LLM + Your Own Data
Instead of retraining models, you inject relevant context at query time. Result? Accurate, grounded AI that doesn't hallucinate.
I've built RAG systems for production at scale. Key lessons:
✔️ Chunk strategy matters more than the model
✔️ Embedding quality = retrieval quality
✔️ Reranking is underratedAsk me anything 👇
#RAG #LLM #AI #GenerativeAI #MachineLearning #WebDev #FullStack
-
От RAG-прототипа к агенту в продакшн: путь по метрикам, а не по моде
На связи Сергей Смирнов, AI-инженер LLMStart.ru. Сегодня расскажу о полноценном кейсе, который мы делали для компании Айтон: агенте-консультанте по 1С:УНФ, который помогает отвечать на вопросы клиентов по базе знаний, реальным диалогам поддержки и контексту конкретного обращения. Разберу всю хронологию, нюансы и путь от первой гипотезы до продакшена, которым уже пользуются клиенты. Для бизнеса этот кейс интересен как пример реальной автоматизации через ИИ: сначала ассистент для сотрудников, потом сервис для клиентов. Для технарей — подходом, где решение эволюционировало от RAG-прототипа к агенту на основании данных и метрик, а не потому, что «так модно».
https://habr.com/ru/companies/llmstart/articles/1038436/
#RAG #LLM #ИИагенты #LangChain #LangFuse #Ragas #метрики_качества #context_engineering #мультимодальность #ии