#rag_pipeline — Public Fediverse posts on home.social

Habr @[email protected] · 2026-04-29 · 12:12 UTC

10 актуальных RAG-подходов: какие реально полезны и когда их применять?

Всем привет, на фоне обновлений в LLM-стеке за последний год, решил собрать практический список RAG-подходов, которые реально используются в продакшене на основе моего опыта и того что я изучал в других кейсах.

https://habr.com/ru/articles/1029616/

#aiразработка #rag_ai #rag_pipeline #retrieval_augmented_generation #llm #llmмодели #vector_search #hybrid_search #graphrag #multimodal

#multimodal #graphrag #hybrid_search #vector_search #llmмодели #llm

Habr @[email protected] · 2026-04-24 · 09:02 UTC

Ваш RAG не умеет думать. А мой умеет

Привет, Хабр! Базовые RAG-системы уже научились неплохо справляться с прямыми вопросами по тексту. Но только если ответ лежит в одном конкретном абзаце, а вопрос сформулирован почти так же, как сам исходный документ. Попробуйте заставить систему связать факты из трёх разных источников или сделать банальный логический вывод. В большинстве случаев результат будет неутешительным. А уж про поиск скрытых связей я даже спрашивать боюсь. Сегодня рассмотрим open-source RAG-фреймворк HippoRAG 2 . В сфере RAG главным преимуществом данного фреймворка является качество ответов, потому что принципы его работы основаны на реальном человеческом мозге . Давайте разберёмся, откуда он взялся, как устроен изнутри и как его запустить.

https://habr.com/ru/companies/ruvds/articles/1025812/

#rag #rag_ai #rag_pipeline #rag_система #HippoRAG #исскуство #ai #graphrag #ruvds_статьи

#ruvds_статьи #graphrag #ai #исскуство #hipporag #rag_система

Habr @[email protected] · 2026-04-15 · 08:22 UTC

RAG: Как собрать свой ретривер для особых случаев

С опытом у RAG-инженера накапливается солидный багаж эвристик и инструментов, которые в определенных задачах превосходят по качеству или скорости стандартные. Фраза «а для этого у меня есть собственный ретривер» звучит с некоторым снобизмом, но добавляет к профессионализму несколько пойнтов. Хотите в свою коллекцию ретривер, который умеет работать с терминами, плохо различимыми в векторном пространстве эмбеддинга, в частности с именами и названиями? Тогда давайте перейдём от снобизма к практике. Начнём с обработки текста и сегментируем его на фрагменты - «чанки». Далее сделаем TFIDF модель, добавим поиск и обернём всё это в ретривер LangChain. Наконец сравним наш ретривер с двумя-тремя стандартными решениями. А Ollama поможет с вопросами для бенчмарка.

https://habr.com/ru/articles/1022244/

#rag #rag_pipeline #text_mining #text_generation #retrieval #ollama #gensim #langchain

#langchain #gensim #ollama #retrieval #text_generation #text_mining

Habr @[email protected] · 2026-03-20 · 16:02 UTC

Память ИИ‑агентов: как агенты запоминают, забывают и учатся

Память ИИ‑агентов: как агенты запоминают, забывают и учатся Всем привет! Продолжаю рассказывать и делиться своим опытом создания и внедрения ИИ-агентов. Сегодня давайте поговорим про память ИИ-агентов. Я поделюсь какие типы памяти использую чаще всего, поговорим про базовый минимум без которого нет смысла пытаться строить ИИ-агентов. Начнём с того как вообще работает контекстное окно и почему его не хватает, потом разберём какие типы памяти бывают, как они хранятся и как подгружаются в контекст.

https://habr.com/ru/articles/1012894/

#openai #claude_code #memory_management #rag #rag_pipeline #память_ии #claude_ai #qdrant #ииагенты #ииассистент

#ииассистент #ииагенты #qdrant #claude_ai #память_ии #rag_pipeline

Habr @[email protected] · 2026-03-12 · 12:02 UTC

[Перевод] Claude Code vs. Codex: исчерпывающее сравнение

Я использовал Claude Code несколько месяцев, потом перешёл на Codex. Недавно вернулся обратно — и причина не в бенчмарках. Также протестировал оба инструмента на одной и той же задаче. В этой статье я разберу разные аспекты Claude Code и Codex, сравню флагманские модели Opus 4.6 и GPT-5.3-Codex, расскажу, что реально влияет на опыт AI-разработки, и покажу кейс-стади: построение RAG-пайплайна в обоих агентах. Сразу предупрежу: читать ~12 минут. По-моему, это оправдано, если вы собираетесь платить $200/месяц за любой из них.

https://habr.com/ru/articles/1009444/

#claude_code #codex #ai_coding_agent #claude_vs_codex #opus_46 #coding_agent_comparison #rag_pipeline

#rag_pipeline #coding_agent_comparison #opus_46 #claude_vs_codex #ai_coding_agent #codex

Habr @[email protected] · 2026-03-12 · 12:02 UTC

[Перевод] Claude Code vs. Codex: исчерпывающее сравнение

Я использовал Claude Code несколько месяцев, потом перешёл на Codex. Недавно вернулся обратно — и причина не в бенчмарках. Также протестировал оба инструмента на одной и той же задаче. В этой статье я разберу разные аспекты Claude Code и Codex, сравню флагманские модели Opus 4.6 и GPT-5.3-Codex, расскажу, что реально влияет на опыт AI-разработки, и покажу кейс-стади: построение RAG-пайплайна в обоих агентах. Сразу предупрежу: читать ~12 минут. По-моему, это оправдано, если вы собираетесь платить $200/месяц за любой из них.

https://habr.com/ru/articles/1009444/

#claude_code #codex #ai_coding_agent #claude_vs_codex #opus_46 #coding_agent_comparison #rag_pipeline

#rag_pipeline #coding_agent_comparison #opus_46 #claude_vs_codex #ai_coding_agent #codex

Habr @[email protected] · 2026-03-12 · 12:02 UTC

[Перевод] Claude Code vs. Codex: исчерпывающее сравнение

Я использовал Claude Code несколько месяцев, потом перешёл на Codex. Недавно вернулся обратно — и причина не в бенчмарках. Также протестировал оба инструмента на одной и той же задаче. В этой статье я разберу разные аспекты Claude Code и Codex, сравню флагманские модели Opus 4.6 и GPT-5.3-Codex, расскажу, что реально влияет на опыт AI-разработки, и покажу кейс-стади: построение RAG-пайплайна в обоих агентах. Сразу предупрежу: читать ~12 минут. По-моему, это оправдано, если вы собираетесь платить $200/месяц за любой из них.

https://habr.com/ru/articles/1009444/

#claude_code #codex #ai_coding_agent #claude_vs_codex #opus_46 #coding_agent_comparison #rag_pipeline

#rag_pipeline #coding_agent_comparison #opus_46 #claude_vs_codex #ai_coding_agent #codex

Habr @[email protected] · 2026-03-12 · 12:02 UTC

[Перевод] Claude Code vs. Codex: исчерпывающее сравнение

Я использовал Claude Code несколько месяцев, потом перешёл на Codex. Недавно вернулся обратно — и причина не в бенчмарках. Также протестировал оба инструмента на одной и той же задаче. В этой статье я разберу разные аспекты Claude Code и Codex, сравню флагманские модели Opus 4.6 и GPT-5.3-Codex, расскажу, что реально влияет на опыт AI-разработки, и покажу кейс-стади: построение RAG-пайплайна в обоих агентах. Сразу предупрежу: читать ~12 минут. По-моему, это оправдано, если вы собираетесь платить $200/месяц за любой из них.

https://habr.com/ru/articles/1009444/

#claude_code #codex #ai_coding_agent #claude_vs_codex #opus_46 #coding_agent_comparison #rag_pipeline

#claude_code #codex #ai_coding_agent #claude_vs_codex #opus_46 #coding_agent_comparison

Habr @[email protected] · 2026-03-10 · 06:42 UTC

Простые проблемы, которые мы решали в ИИ-стартапе

Предыстория. Ну как ИИ-стартап, в общем-то обычный SaaS но с ключевыми задачками в бизнес-процессах для LLM. Задача основателю казалась простой. Нужно было построить систему, которая принимает пользовательский запрос, анализирует контекст пользователя, извлекает релевантные данные и формирует ответ. На первом этапе архитектура ИИ-слоя выглядела очень просто и типично: user request ⭢ RAG retrieval ⭢ LLM ⭢ answer В прототипе все работало отлично. Но после запуска в реальном продукте начались первые проблемы. Именно тогда этот стартап и попал ко мне.

https://habr.com/ru/articles/1008230/

#стартап #команда_разработки #команда_стартапа #retrieval #rag #rag_система #rag_pipeline #ииинжиниринг

#ииинжиниринг #rag_pipeline #rag_система #rag #retrieval #команда_стартапа

Habr @[email protected] · 2026-02-18 · 19:32 UTC

RAG на PHP + Qdrant: быстрый MVP для внутренней базы знаний

RAG на PHP - звучит непривычно. Делюсь опытом построения чат-бота для поиска по внутренней базе документов: Symfony, Qdrant с гибридным поиском, YandexGPT для embedding и генерации ответов. Внутри — готовый код, подводные камни чанкинга и советы, которые сэкономят вам время.

https://habr.com/ru/articles/1001156/

#rag #retrieval_augmented_generation #llm #qdrant #yandexgpt #php #rag_pipeline #neuron

#neuron #rag_pipeline #php #yandexgpt #qdrant #llm

Habr @[email protected] · 2026-01-29 · 16:42 UTC

На чём будут учиться нейросети в 2026

На чём будут учиться нейросети дальше в 2026-2027 , если публичные Q&A-площадки (вроде StackExchange/Stack Overflow "высыхают". Небольшая исследовательская заметка какие источники данных будут доминировать в 2026–2027, и почему “интернет как датасет” заканчивается в привычном виде.

https://habr.com/ru/articles/990738/

#Stack_Overflow #FineWeb #Hugging_Face #AI #RAG #rag_pipeline

#rag_pipeline #rag #ai #hugging_face #fineweb #stack_overflow

Habr @[email protected] · 2026-01-29 · 16:42 UTC

На чём будут учиться нейросети в 2026

На чём будут учиться нейросети дальше в 2026-2027 , если публичные Q&A-площадки (вроде StackExchange/Stack Overflow "высыхают". Небольшая исследовательская заметка какие источники данных будут доминировать в 2026–2027, и почему “интернет как датасет” заканчивается в привычном виде.

https://habr.com/ru/articles/990738/

#Stack_Overflow #FineWeb #Hugging_Face #AI #RAG #rag_pipeline

#rag_pipeline #rag #ai #hugging_face #fineweb #stack_overflow

Habr @[email protected] · 2026-01-29 · 16:42 UTC

На чём будут учиться нейросети в 2026

На чём будут учиться нейросети дальше в 2026-2027 , если публичные Q&A-площадки (вроде StackExchange/Stack Overflow "высыхают". Небольшая исследовательская заметка какие источники данных будут доминировать в 2026–2027, и почему “интернет как датасет” заканчивается в привычном виде.

https://habr.com/ru/articles/990738/

#Stack_Overflow #FineWeb #Hugging_Face #AI #RAG #rag_pipeline

#rag_pipeline #rag #ai #hugging_face #fineweb #stack_overflow

Habr @[email protected] · 2026-01-29 · 16:42 UTC

На чём будут учиться нейросети в 2026

На чём будут учиться нейросети дальше в 2026-2027 , если публичные Q&A-площадки (вроде StackExchange/Stack Overflow "высыхают". Небольшая исследовательская заметка какие источники данных будут доминировать в 2026–2027, и почему “интернет как датасет” заканчивается в привычном виде.

https://habr.com/ru/articles/990738/

#Stack_Overflow #FineWeb #Hugging_Face #AI #RAG #rag_pipeline

#stack_overflow #fineweb #hugging_face #ai #rag #rag_pipeline

Habr @[email protected] · 2026-01-02 · 11:32 UTC

Ragex: Гибридный RAG для анализа кода

Я поломался, поломался — и поломался на осколки. Признаю́: железные помощники Т9 действительно могут приносить пользу в разработке. Единственное, что мне не нравилось — то, что весь проект большой и хорошо натренированной модели не скормишь, а значит — неизбежны потери контекста, размывание смыслов и джойсовские галлюцинации. Я уже давно понял: если мне нужно, чтобы что-то было сделано хорошо, — делегирование отпадает, придётся брать в руки молоток самому. Это касается любых жизненных аспектов: варки борща, замены сантехники, перевода Эдгара Аллана По или Антонио Мачадо на русский, или, там, программирования. Когда БЯМ научились подключать сторонние MCP-сервера, произошел качественный скачок. Теперь не нужно файнтьюнить модель, можно файнтьюнить буковку « R » из акронима « R AG ». Я-то лучше знаю, как правильно извлекать смыслы из моего личного контента. Если речь про код — лучше всего искать правду в AST . Так и был зачат Ragex — MCP-сервер для семантического анализа кодовых баз с элементами чёрной магии. Проект, понятно, написан на Elixir , потому что ну а на чем еще?

https://habr.com/ru/articles/982418/

#mcpserver #mcptools #mcpservers #mcpсервер #mcp_server #rag #rag_pipeline #rag_ai

#rag_ai #rag_pipeline #rag #mcp_server #mcpсервер #mcpservers

Habr @[email protected] · 2026-01-02 · 11:32 UTC

Ragex: Гибридный RAG для анализа кода

Я поломался, поломался — и поломался на осколки. Признаю́: железные помощники Т9 действительно могут приносить пользу в разработке. Единственное, что мне не нравилось — то, что весь проект большой и хорошо натренированной модели не скормишь, а значит — неизбежны потери контекста, размывание смыслов и джойсовские галлюцинации. Я уже давно понял: если мне нужно, чтобы что-то было сделано хорошо, — делегирование отпадает, придётся брать в руки молоток самому. Это касается любых жизненных аспектов: варки борща, замены сантехники, перевода Эдгара Аллана По или Антонио Мачадо на русский, или, там, программирования. Когда БЯМ научились подключать сторонние MCP-сервера, произошел качественный скачок. Теперь не нужно файнтьюнить модель, можно файнтьюнить буковку « R » из акронима « R AG ». Я-то лучше знаю, как правильно извлекать смыслы из моего личного контента. Если речь про код — лучше всего искать правду в AST . Так и был зачат Ragex — MCP-сервер для семантического анализа кодовых баз с элементами чёрной магии. Проект, понятно, написан на Elixir , потому что ну а на чем еще?

https://habr.com/ru/articles/982418/

#mcpserver #mcptools #mcpservers #mcpсервер #mcp_server #rag #rag_pipeline #rag_ai

#rag_ai #rag_pipeline #rag #mcp_server #mcpсервер #mcpservers

Habr @[email protected] · 2026-01-02 · 11:32 UTC

Ragex: Гибридный RAG для анализа кода

Я поломался, поломался — и поломался на осколки. Признаю́: железные помощники Т9 действительно могут приносить пользу в разработке. Единственное, что мне не нравилось — то, что весь проект большой и хорошо натренированной модели не скормишь, а значит — неизбежны потери контекста, размывание смыслов и джойсовские галлюцинации. Я уже давно понял: если мне нужно, чтобы что-то было сделано хорошо, — делегирование отпадает, придётся брать в руки молоток самому. Это касается любых жизненных аспектов: варки борща, замены сантехники, перевода Эдгара Аллана По или Антонио Мачадо на русский, или, там, программирования. Когда БЯМ научились подключать сторонние MCP-сервера, произошел качественный скачок. Теперь не нужно файнтьюнить модель, можно файнтьюнить буковку « R » из акронима « R AG ». Я-то лучше знаю, как правильно извлекать смыслы из моего личного контента. Если речь про код — лучше всего искать правду в AST . Так и был зачат Ragex — MCP-сервер для семантического анализа кодовых баз с элементами чёрной магии. Проект, понятно, написан на Elixir , потому что ну а на чем еще?

https://habr.com/ru/articles/982418/

#mcpserver #mcptools #mcpservers #mcpсервер #mcp_server #rag #rag_pipeline #rag_ai

#rag_ai #rag_pipeline #rag #mcp_server #mcpсервер #mcpservers

Habr @[email protected] · 2026-01-02 · 11:32 UTC

Ragex: Гибридный RAG для анализа кода

Я поломался, поломался — и поломался на осколки. Признаю́: железные помощники Т9 действительно могут приносить пользу в разработке. Единственное, что мне не нравилось — то, что весь проект большой и хорошо натренированной модели не скормишь, а значит — неизбежны потери контекста, размывание смыслов и джойсовские галлюцинации. Я уже давно понял: если мне нужно, чтобы что-то было сделано хорошо, — делегирование отпадает, придётся брать в руки молоток самому. Это касается любых жизненных аспектов: варки борща, замены сантехники, перевода Эдгара Аллана По или Антонио Мачадо на русский, или, там, программирования. Когда БЯМ научились подключать сторонние MCP-сервера, произошел качественный скачок. Теперь не нужно файнтьюнить модель, можно файнтьюнить буковку « R » из акронима « R AG ». Я-то лучше знаю, как правильно извлекать смыслы из моего личного контента. Если речь про код — лучше всего искать правду в AST . Так и был зачат Ragex — MCP-сервер для семантического анализа кодовых баз с элементами чёрной магии. Проект, понятно, написан на Elixir , потому что ну а на чем еще?

https://habr.com/ru/articles/982418/

#mcpserver #mcptools #mcpservers #mcpсервер #mcp_server #rag #rag_pipeline #rag_ai

#mcpserver #mcptools #mcpservers #mcpсервер #mcp_server #rag

Habr @[email protected] · 2025-10-21 · 05:22 UTC

Документный хаос? RAG-система придёт на помощь

Статья описывает практическую реализацию системы Retrieval-Augmented Generation (RAG) для превращения документов в интерактивную базу знаний. Показано, как хранение эмбеддингов в Qdrant и интеграция с языковой моделью (LLM) позволяют быстро получать точные ответы на вопросы. Рассматриваются архитектура, ключевые компоненты и внутренние механизмы работы системы, полезные для разработчиков и новичков в области RAG.

https://habr.com/ru/articles/955768/

#rag #ai_assistant #ai_agent #rag_система #rag_pipeline #rag_техники #rag_ai #document_management #python

#python #document_management #rag_ai #rag_техники #rag_pipeline #rag_система

Habr @[email protected] · 2025-07-31 · 12:52 UTC

Retrieval-Augmented Generation (RAG): глубокий технический обзор

Retrieval-Augmented Generation (RAG) – это архитектурный подход к генеративным моделям, который сочетает навыки поиска информации с генеративными возможностями больших языковых моделей (LLM). Идея RAG была предложена в 2020 году, чтобы преодолеть ограничение LLM – замкнутость на знаниях из обучающих данных. Вместо попыток «вживить» все знания в параметры модели, RAG-подход позволяет модели запрашивать актуальные сведения из внешних источников (баз знаний) во время генерации ответа . Это обеспечивает более точные и актуальные ответы, опирающиеся на факты, а не только на память модели. В этой статье мы подробно рассмотрим : архитектуру RAG, её компоненты и этапы работы, современные инструменты и практики для реализации RAG, примеры кода на Python, кейсы применения в бизнесе и науке, технические вызовы и лучшие практики, сравнение RAG с классическим fine-tuning, перспективы технологии.

https://habr.com/ru/articles/931396/

#rag #retrieval_augmented_generation #llm #ai #rag_pipeline #rag_ai #finetuning #ragas

#ragas #finetuning #rag_ai #rag_pipeline #ai #llm

Habr @[email protected] · 2025-07-13 · 10:22 UTC

Свой ChatGPT на документах: делаем RAG с нуля

Всем привет! Наверняка у вас были ситуации, когда нужно быстро найти что-то в длинном документе-договоре, инструкции или отчёте. Сегодня я покажу, как сделать своего помощника, который будет отвечать на такие вопросы автоматически. Соберем RAG с нуля: загрузим документы, "нарежем" их на куски, проиндексируем в векторной базе данных Qdrant и подключим LLaMA. Если вы увидели незнакомые слова — не пугайтесь, далее я расскажу об этом подробно.

https://habr.com/ru/companies/amvera/articles/927138/

#rag #rag_ai #rag_pipeline #Retrieval_Augmented_Generation #ии_агент #ai_agent #ии_приложение #ai_app #ai_application #llama_33_70B

#rag #rag_ai #rag_pipeline #retrieval_augmented_generation #ии_агент #ai_agent

Habr @[email protected] · 2025-05-16 · 20:32 UTC

[Перевод] Часть 4. Обзор технологий RAG для LLM: аугментация извлеченных данных

Продолжаю адаптированный перевод статьи китайских исследователей Retrieval-Augmented Generation for Large Language Models: A Survey (ссылка на первую часть — здесь , на вторую часть — здесь , третью часть — здесь ). В этой, четвертой части авторы совсем скромненько, словно тренировались заполнять налоговую декларацию, разбирают технологии аугментации извлеченных данных. Поскольку без пояснительной бригады часть их информации оказалась для меня совершенной абракадаброй (напомню, я — переводчик, то бишь гуманитарий) , я не поленился пройтись по упомянутым авторами ссылочкам на исследования, взять оттуда схемки и картинки, и добавил их к этой части тоже. Надеюсь, с ними рассуждения и наблюдения авторов будут значительно прозрачнее. Поехали! Прочитать остальные буквы

https://habr.com/ru/articles/910162/

#языковые_модели #llm #llmмодели #llmприложения #llmагент #llmархитектура #rag #rag_pipeline #retrieval_augmented_generation #retrieval