#retrieval_augmented_generation — Public Fediverse posts on home.social

Habr @[email protected] · 2026-07-28 · 05:02 UTC

Как я собрал антискам‑бота на грязных данных: детектор, типизатор и грабли по дороге

В первой статье я разбирал RAG-модуль этого проекта и главный вывод — что RAG оказался про замеры, а не про код. Здесь — про то, как устроена вся система вокруг него: классификатор, который решает, кому вообще нужна помощь, определитель типа проблемы и архитектура, которая всё это связывает. Эта статья скорее про ML-инженерию на реальных, грязных данных, чем про RAG. Про то, как собрать рабочий классификатор, когда у тебя нет размеченного датасета, метрики врут, а данные — это поток из телеграм-чатов с опечатками, сленгом и тремя языками вперемешку. Цифры все реальные, из рабочих логов.

https://habr.com/ru/articles/1063028/

#rag #rag_ai #rag_pipeline #rag_система #rag_техники #retrievalaugmented_generation #retrieval_augmented_generation

#retrieval_augmented_generation #retrievalaugmented_generation #rag_техники #rag_система #rag_pipeline #rag_ai

Habr @[email protected] · 2026-07-28 · 05:02 UTC

Как я собрал антискам‑бота на грязных данных: детектор, типизатор и грабли по дороге

В первой статье я разбирал RAG-модуль этого проекта и главный вывод — что RAG оказался про замеры, а не про код. Здесь — про то, как устроена вся система вокруг него: классификатор, который решает, кому вообще нужна помощь, определитель типа проблемы и архитектура, которая всё это связывает. Эта статья скорее про ML-инженерию на реальных, грязных данных, чем про RAG. Про то, как собрать рабочий классификатор, когда у тебя нет размеченного датасета, метрики врут, а данные — это поток из телеграм-чатов с опечатками, сленгом и тремя языками вперемешку. Цифры все реальные, из рабочих логов.

https://habr.com/ru/articles/1063028/

#rag #rag_ai #rag_pipeline #rag_система #rag_техники #retrievalaugmented_generation #retrieval_augmented_generation

#retrieval_augmented_generation #retrievalaugmented_generation #rag_техники #rag_система #rag_pipeline #rag_ai

Habr @[email protected] · 2026-07-28 · 05:02 UTC

Как я собрал антискам‑бота на грязных данных: детектор, типизатор и грабли по дороге

В первой статье я разбирал RAG-модуль этого проекта и главный вывод — что RAG оказался про замеры, а не про код. Здесь — про то, как устроена вся система вокруг него: классификатор, который решает, кому вообще нужна помощь, определитель типа проблемы и архитектура, которая всё это связывает. Эта статья скорее про ML-инженерию на реальных, грязных данных, чем про RAG. Про то, как собрать рабочий классификатор, когда у тебя нет размеченного датасета, метрики врут, а данные — это поток из телеграм-чатов с опечатками, сленгом и тремя языками вперемешку. Цифры все реальные, из рабочих логов.

https://habr.com/ru/articles/1063028/

#rag #rag_ai #rag_pipeline #rag_система #rag_техники #retrievalaugmented_generation #retrieval_augmented_generation

#rag #rag_ai #rag_pipeline #rag_система #rag_техники #retrievalaugmented_generation

Habr @[email protected] · 2026-07-27 · 05:12 UTC

RAG — это про замеры, а не про код. История одного бота, где почти всё «правильное» сделало хуже

Есть жанр статей про RAG, который выглядит так: подключаем векторную базу, берём эмбеддер, сверху реранкер, для верности — гибридный поиск с BM25, и вот у нас продакшн-ready система. Двадцать строк кода, стрелочки на схеме, всё летает. Я прошёл этот путь до конца на реальных данных. И почти каждое «правильное» улучшение из этого списка на моих данных сделало хуже . BM25 уронил метрику. Реранкер уронил метрику. Дважды, в двух разных конфигурациях. Единственное, что реально помогло, — не код, а несколько дней возни с данными и замерами. Это не статья «RAG не работает». RAG работает. Это статья о том, что настоящая работа в RAG — не в коде, который пишется за день, а в eval-харнессе, чистке корпуса и честных замерах, которые показывают, что из индустриальных дефолтов вам подходит, а что вредит. И проверить это можно только на своих данных — «так принято» тут не аргумент.

https://habr.com/ru/articles/1063026/

#rag #rag_система #rag_техники #rag_pipeline #rag_ai #retrievalaugmented_generation #retrival_augumented_generation #retrieval_augmented_generation

#retrieval_augmented_generation #retrival_augumented_generation #retrievalaugmented_generation #rag_ai #rag_pipeline #rag_техники

Habr @[email protected] · 2026-07-27 · 05:12 UTC

RAG — это про замеры, а не про код. История одного бота, где почти всё «правильное» сделало хуже

Есть жанр статей про RAG, который выглядит так: подключаем векторную базу, берём эмбеддер, сверху реранкер, для верности — гибридный поиск с BM25, и вот у нас продакшн-ready система. Двадцать строк кода, стрелочки на схеме, всё летает. Я прошёл этот путь до конца на реальных данных. И почти каждое «правильное» улучшение из этого списка на моих данных сделало хуже . BM25 уронил метрику. Реранкер уронил метрику. Дважды, в двух разных конфигурациях. Единственное, что реально помогло, — не код, а несколько дней возни с данными и замерами. Это не статья «RAG не работает». RAG работает. Это статья о том, что настоящая работа в RAG — не в коде, который пишется за день, а в eval-харнессе, чистке корпуса и честных замерах, которые показывают, что из индустриальных дефолтов вам подходит, а что вредит. И проверить это можно только на своих данных — «так принято» тут не аргумент.

https://habr.com/ru/articles/1063026/

#rag #rag_система #rag_техники #rag_pipeline #rag_ai #retrievalaugmented_generation #retrival_augumented_generation #retrieval_augmented_generation

#retrieval_augmented_generation #retrival_augumented_generation #retrievalaugmented_generation #rag_ai #rag_pipeline #rag_техники

Habr @[email protected] · 2026-07-27 · 05:12 UTC

RAG — это про замеры, а не про код. История одного бота, где почти всё «правильное» сделало хуже

Есть жанр статей про RAG, который выглядит так: подключаем векторную базу, берём эмбеддер, сверху реранкер, для верности — гибридный поиск с BM25, и вот у нас продакшн-ready система. Двадцать строк кода, стрелочки на схеме, всё летает. Я прошёл этот путь до конца на реальных данных. И почти каждое «правильное» улучшение из этого списка на моих данных сделало хуже . BM25 уронил метрику. Реранкер уронил метрику. Дважды, в двух разных конфигурациях. Единственное, что реально помогло, — не код, а несколько дней возни с данными и замерами. Это не статья «RAG не работает». RAG работает. Это статья о том, что настоящая работа в RAG — не в коде, который пишется за день, а в eval-харнессе, чистке корпуса и честных замерах, которые показывают, что из индустриальных дефолтов вам подходит, а что вредит. И проверить это можно только на своих данных — «так принято» тут не аргумент.

https://habr.com/ru/articles/1063026/

#rag #rag_система #rag_техники #rag_pipeline #rag_ai #retrievalaugmented_generation #retrival_augumented_generation #retrieval_augmented_generation

#rag #rag_система #rag_техники #rag_pipeline #rag_ai #retrievalaugmented_generation

Habr @[email protected] · 2026-05-27 · 09:02 UTC

Почему RAG — фундамент любой AI-трансформации

За последние годы большинство AI-проектов в компаниях стартуют одинаково: сначала делают чат-бота, затем добавляют агентов, автоматизируют отдельные процессы и ожидают роста эффективности. На практике такие проекты часто не дают устойчивого результата. Модель может корректно генерировать текст, демонстрации выглядят убедительно, но в реальной работе ответы оказываются нестабильными, противоречивыми и не связанными с внутренними стандартами компании. Основная причина — отсутствие единого слоя знаний. В проекте для ресторанной группы с 10+ заведениями и историей более 15 лет мы сознательно начали не с агентов и не с интерфейсов, а с построения корпоративной RAG-инфраструктуры. Этот слой стал основой всей последующей AI-архитектуры.

https://habr.com/ru/articles/1039986/

#rag #искусственный_интеллект #llm #retrieval_augmented_generation #векторная_база_данных #embeddings #корпоративные_данные #ai_automation #knowledge_base #hallucinations

#hallucinations #knowledge_base #ai_automation #корпоративные_данные #embeddings #векторная_база_данных

Habr @[email protected] · 2026-05-27 · 09:02 UTC

Почему RAG — фундамент любой AI-трансформации

За последние годы большинство AI-проектов в компаниях стартуют одинаково: сначала делают чат-бота, затем добавляют агентов, автоматизируют отдельные процессы и ожидают роста эффективности. На практике такие проекты часто не дают устойчивого результата. Модель может корректно генерировать текст, демонстрации выглядят убедительно, но в реальной работе ответы оказываются нестабильными, противоречивыми и не связанными с внутренними стандартами компании. Основная причина — отсутствие единого слоя знаний. В проекте для ресторанной группы с 10+ заведениями и историей более 15 лет мы сознательно начали не с агентов и не с интерфейсов, а с построения корпоративной RAG-инфраструктуры. Этот слой стал основой всей последующей AI-архитектуры.

https://habr.com/ru/articles/1039986/

#rag #искусственный_интеллект #llm #retrieval_augmented_generation #векторная_база_данных #embeddings #корпоративные_данные #ai_automation #knowledge_base #hallucinations

#ai_automation #корпоративные_данные #embeddings #векторная_база_данных #retrieval_augmented_generation #llm

Habr @[email protected] · 2026-05-27 · 09:02 UTC

Почему RAG — фундамент любой AI-трансформации

За последние годы большинство AI-проектов в компаниях стартуют одинаково: сначала делают чат-бота, затем добавляют агентов, автоматизируют отдельные процессы и ожидают роста эффективности. На практике такие проекты часто не дают устойчивого результата. Модель может корректно генерировать текст, демонстрации выглядят убедительно, но в реальной работе ответы оказываются нестабильными, противоречивыми и не связанными с внутренними стандартами компании. Основная причина — отсутствие единого слоя знаний. В проекте для ресторанной группы с 10+ заведениями и историей более 15 лет мы сознательно начали не с агентов и не с интерфейсов, а с построения корпоративной RAG-инфраструктуры. Этот слой стал основой всей последующей AI-архитектуры.

https://habr.com/ru/articles/1039986/

#rag #искусственный_интеллект #llm #retrieval_augmented_generation #векторная_база_данных #embeddings #корпоративные_данные #ai_automation #knowledge_base #hallucinations

#rag #искусственный_интеллект #llm #retrieval_augmented_generation #векторная_база_данных #embeddings

Habr @[email protected] · 2026-05-18 · 06:12 UTC

RAG в enterprise: 70-80% проблем не в модели, а в данных

Эта статья родилась из работы над

https://habr.com/ru/companies/alpinadigital/articles/1036196/

#RAG #enterprise_AI #retrieval_augmented_generation #embeddings #GraphRAG #Agentic_RAG #BM25 #chunking #LLM #AlpinaGPT

#alpinagpt #llm #chunking #bm25 #agentic_rag #graphrag

Habr @[email protected] · 2026-05-18 · 06:12 UTC

RAG в enterprise: 70-80% проблем не в модели, а в данных

Эта статья родилась из работы над

https://habr.com/ru/companies/alpinadigital/articles/1036196/

#RAG #enterprise_AI #retrieval_augmented_generation #embeddings #GraphRAG #Agentic_RAG #BM25 #chunking #LLM #AlpinaGPT

#alpinagpt #llm #chunking #bm25 #agentic_rag #graphrag

Habr @[email protected] · 2026-05-18 · 06:12 UTC

RAG в enterprise: 70-80% проблем не в модели, а в данных

Эта статья родилась из работы над

https://habr.com/ru/companies/alpinadigital/articles/1036196/

#RAG #enterprise_AI #retrieval_augmented_generation #embeddings #GraphRAG #Agentic_RAG #BM25 #chunking #LLM #AlpinaGPT

#rag #enterprise_ai #retrieval_augmented_generation #embeddings #graphrag #agentic_rag

Habr @[email protected] · 2026-04-29 · 12:12 UTC

10 актуальных RAG-подходов: какие реально полезны и когда их применять?

Всем привет, на фоне обновлений в LLM-стеке за последний год, решил собрать практический список RAG-подходов, которые реально используются в продакшене на основе моего опыта и того что я изучал в других кейсах.

https://habr.com/ru/articles/1029616/

#aiразработка #rag_ai #rag_pipeline #retrieval_augmented_generation #llm #llmмодели #vector_search #hybrid_search #graphrag #multimodal

#multimodal #graphrag #hybrid_search #vector_search #llmмодели #llm

Habr @[email protected] · 2026-04-29 · 12:12 UTC

10 актуальных RAG-подходов: какие реально полезны и когда их применять?

Всем привет, на фоне обновлений в LLM-стеке за последний год, решил собрать практический список RAG-подходов, которые реально используются в продакшене на основе моего опыта и того что я изучал в других кейсах.

https://habr.com/ru/articles/1029616/

#aiразработка #rag_ai #rag_pipeline #retrieval_augmented_generation #llm #llmмодели #vector_search #hybrid_search #graphrag #multimodal

#multimodal #graphrag #hybrid_search #vector_search #llmмодели #llm

Habr @[email protected] · 2026-04-29 · 12:12 UTC

10 актуальных RAG-подходов: какие реально полезны и когда их применять?

Всем привет, на фоне обновлений в LLM-стеке за последний год, решил собрать практический список RAG-подходов, которые реально используются в продакшене на основе моего опыта и того что я изучал в других кейсах.

https://habr.com/ru/articles/1029616/

#aiразработка #rag_ai #rag_pipeline #retrieval_augmented_generation #llm #llmмодели #vector_search #hybrid_search #graphrag #multimodal

#aiразработка #rag_ai #rag_pipeline #retrieval_augmented_generation #llm #llmмодели

Habr @[email protected] · 2026-03-31 · 08:52 UTC

Книга: «Основы GraphRAG. Улучшенный RAG на базе графов знаний»

Привет, Хабожители! Создайте и разверните систему GraphRAG производственного уровня. Научитесь извлекать структурированные знания из текста и комбинировать методы векторного поиска с поиском по графам. Книга богата практическими примерами: от создания инструмента поиска по векторному сходству и приложения Agentic RAG до оценки эффективности и точности результатов работы такого приложения.

https://habr.com/ru/companies/piter/articles/1013810/

#rag_ai #retrieval_augmented_generation #llm #graphrag

#graphrag #llm #retrieval_augmented_generation #rag_ai

Habr @[email protected] · 2026-03-31 · 08:52 UTC

Книга: «Основы GraphRAG. Улучшенный RAG на базе графов знаний»

Привет, Хабожители! Создайте и разверните систему GraphRAG производственного уровня. Научитесь извлекать структурированные знания из текста и комбинировать методы векторного поиска с поиском по графам. Книга богата практическими примерами: от создания инструмента поиска по векторному сходству и приложения Agentic RAG до оценки эффективности и точности результатов работы такого приложения.

https://habr.com/ru/companies/piter/articles/1013810/

#rag_ai #retrieval_augmented_generation #llm #graphrag

#graphrag #llm #retrieval_augmented_generation #rag_ai

Habr @[email protected] · 2026-03-31 · 08:52 UTC

Книга: «Основы GraphRAG. Улучшенный RAG на базе графов знаний»

Привет, Хабожители! Создайте и разверните систему GraphRAG производственного уровня. Научитесь извлекать структурированные знания из текста и комбинировать методы векторного поиска с поиском по графам. Книга богата практическими примерами: от создания инструмента поиска по векторному сходству и приложения Agentic RAG до оценки эффективности и точности результатов работы такого приложения.

https://habr.com/ru/companies/piter/articles/1013810/

#rag_ai #retrieval_augmented_generation #llm #graphrag

Habr @[email protected] · 2026-03-29 · 06:42 UTC

Как помочь вашему RAG адаптироваться? Принимайте DRAG with KNEE! Часть 1

Все мы проходили через это: скармливаешь RAG‑системе сложный PDF на 50 страниц, а она в ответ либо галлюцинирует, либо вываливает на LLM простыню нерелевантного текста, съедая ваш бюджет на токены быстрее, чем вы успеваете сказать «GPT-4o». Проблема в том, что классический подход со статическим top_k — это костыль, который либо не додает контекста, либо вызывает у модели информационное «ожирение» (заполняет контекст нерелевантным мусором). Нашему RAG нужно помочь адаптироваться к безжалостной среде разрозненных документов! Я потратил выходные на то, чтобы решить эту проблему фундаментально. В итоге на свет появился DRAG with KNEE (Dynamic RAG with Knee‑point pruning) — алгоритм, который не просто ищет «похожее», а выстраивает иерархию документов и безжалостно отсекает лишнее с помощью геометрического анализа «колена». В этой статье я покажу, как с помощью Qdrant, Python и капли математики сделать ваш RAG адаптивным. Читать далее?

https://habr.com/ru/articles/1016438/

#rag #knee #hierarchical_structure #optimization #retrieval_augmented_generation

#retrieval_augmented_generation #optimization #hierarchical_structure #knee #rag

Habr @[email protected] · 2026-03-29 · 06:42 UTC

Как помочь вашему RAG адаптироваться? Принимайте DRAG with KNEE! Часть 1

Все мы проходили через это: скармливаешь RAG‑системе сложный PDF на 50 страниц, а она в ответ либо галлюцинирует, либо вываливает на LLM простыню нерелевантного текста, съедая ваш бюджет на токены быстрее, чем вы успеваете сказать «GPT-4o». Проблема в том, что классический подход со статическим top_k — это костыль, который либо не додает контекста, либо вызывает у модели информационное «ожирение» (заполняет контекст нерелевантным мусором). Нашему RAG нужно помочь адаптироваться к безжалостной среде разрозненных документов! Я потратил выходные на то, чтобы решить эту проблему фундаментально. В итоге на свет появился DRAG with KNEE (Dynamic RAG with Knee‑point pruning) — алгоритм, который не просто ищет «похожее», а выстраивает иерархию документов и безжалостно отсекает лишнее с помощью геометрического анализа «колена». В этой статье я покажу, как с помощью Qdrant, Python и капли математики сделать ваш RAG адаптивным. Читать далее?

https://habr.com/ru/articles/1016438/

#rag #knee #hierarchical_structure #optimization #retrieval_augmented_generation

#retrieval_augmented_generation #optimization #hierarchical_structure #knee #rag

Habr @[email protected] · 2026-03-29 · 06:42 UTC

Как помочь вашему RAG адаптироваться? Принимайте DRAG with KNEE! Часть 1

Все мы проходили через это: скармливаешь RAG‑системе сложный PDF на 50 страниц, а она в ответ либо галлюцинирует, либо вываливает на LLM простыню нерелевантного текста, съедая ваш бюджет на токены быстрее, чем вы успеваете сказать «GPT-4o». Проблема в том, что классический подход со статическим top_k — это костыль, который либо не додает контекста, либо вызывает у модели информационное «ожирение» (заполняет контекст нерелевантным мусором). Нашему RAG нужно помочь адаптироваться к безжалостной среде разрозненных документов! Я потратил выходные на то, чтобы решить эту проблему фундаментально. В итоге на свет появился DRAG with KNEE (Dynamic RAG with Knee‑point pruning) — алгоритм, который не просто ищет «похожее», а выстраивает иерархию документов и безжалостно отсекает лишнее с помощью геометрического анализа «колена». В этой статье я покажу, как с помощью Qdrant, Python и капли математики сделать ваш RAG адаптивным. Читать далее?

https://habr.com/ru/articles/1016438/

#rag #knee #hierarchical_structure #optimization #retrieval_augmented_generation

Habr @[email protected] · 2026-03-25 · 10:32 UTC

От 0.034 до 0.791 и обратно: Legal RAG, 17 итераций и стена масштабирования

Я участвовал в ARLC 2026 — юридическом AI-челлендже по построению RAG-пайплайна поверх корпуса судебных решений и законов. Соло, с Claude Code в качестве напарника. За 5 дней и 17 итераций прошёл путь от 0.034 до 0.791 на warmup — а потом вышел в финал и потерял 42% на 300 документах вместо 30. Внутри — архитектура, код, математика F-beta, три провала и честный разбор работы с AI-ассистентом.

https://habr.com/ru/articles/1014758/

#RAG #retrieval_augmented_generation #legal_AI #Claude #grounding #BM25 #reranking #NLP #соревнование

#соревнование #nlp #reranking #bm25 #grounding #claude

Habr @[email protected] · 2026-03-25 · 10:32 UTC

От 0.034 до 0.791 и обратно: Legal RAG, 17 итераций и стена масштабирования

Я участвовал в ARLC 2026 — юридическом AI-челлендже по построению RAG-пайплайна поверх корпуса судебных решений и законов. Соло, с Claude Code в качестве напарника. За 5 дней и 17 итераций прошёл путь от 0.034 до 0.791 на warmup — а потом вышел в финал и потерял 42% на 300 документах вместо 30. Внутри — архитектура, код, математика F-beta, три провала и честный разбор работы с AI-ассистентом.

https://habr.com/ru/articles/1014758/

#RAG #retrieval_augmented_generation #legal_AI #Claude #grounding #BM25 #reranking #NLP #соревнование

#соревнование #nlp #reranking #bm25 #grounding #claude

Habr @[email protected] · 2026-03-25 · 10:32 UTC

От 0.034 до 0.791 и обратно: Legal RAG, 17 итераций и стена масштабирования

Я участвовал в ARLC 2026 — юридическом AI-челлендже по построению RAG-пайплайна поверх корпуса судебных решений и законов. Соло, с Claude Code в качестве напарника. За 5 дней и 17 итераций прошёл путь от 0.034 до 0.791 на warmup — а потом вышел в финал и потерял 42% на 300 документах вместо 30. Внутри — архитектура, код, математика F-beta, три провала и честный разбор работы с AI-ассистентом.

https://habr.com/ru/articles/1014758/

#RAG #retrieval_augmented_generation #legal_AI #Claude #grounding #BM25 #reranking #NLP #соревнование

#rag #retrieval_augmented_generation #legal_ai #claude #grounding #bm25

Habr @[email protected] · 2026-02-18 · 19:32 UTC

RAG на PHP + Qdrant: быстрый MVP для внутренней базы знаний

RAG на PHP - звучит непривычно. Делюсь опытом построения чат-бота для поиска по внутренней базе документов: Symfony, Qdrant с гибридным поиском, YandexGPT для embedding и генерации ответов. Внутри — готовый код, подводные камни чанкинга и советы, которые сэкономят вам время.

https://habr.com/ru/articles/1001156/

#rag #retrieval_augmented_generation #llm #qdrant #yandexgpt #php #rag_pipeline #neuron

#neuron #rag_pipeline #php #yandexgpt #qdrant #llm

Habr @[email protected] · 2026-02-18 · 19:32 UTC

RAG на PHP + Qdrant: быстрый MVP для внутренней базы знаний

RAG на PHP - звучит непривычно. Делюсь опытом построения чат-бота для поиска по внутренней базе документов: Symfony, Qdrant с гибридным поиском, YandexGPT для embedding и генерации ответов. Внутри — готовый код, подводные камни чанкинга и советы, которые сэкономят вам время.

https://habr.com/ru/articles/1001156/

#rag #retrieval_augmented_generation #llm #qdrant #yandexgpt #php #rag_pipeline #neuron

#neuron #rag_pipeline #php #yandexgpt #qdrant #llm

Habr @[email protected] · 2026-02-18 · 19:32 UTC

RAG на PHP + Qdrant: быстрый MVP для внутренней базы знаний

RAG на PHP - звучит непривычно. Делюсь опытом построения чат-бота для поиска по внутренней базе документов: Symfony, Qdrant с гибридным поиском, YandexGPT для embedding и генерации ответов. Внутри — готовый код, подводные камни чанкинга и советы, которые сэкономят вам время.

https://habr.com/ru/articles/1001156/

#rag #retrieval_augmented_generation #llm #qdrant #yandexgpt #php #rag_pipeline #neuron

#rag #retrieval_augmented_generation #llm #qdrant #yandexgpt #php

Habr @[email protected] · 2025-09-21 · 16:52 UTC

Прокачиваем RAG: тестируем техники и считаем их эффективность. Часть 2

В прошлой части мы подробно разобрали 11 популярных техник RAG: как они устроены, какие у них есть сильные и слабые стороны, и в каких сценариях они могут быть полезны. Теперь пришло время перейти от теории к практике и посмотреть, как эти подходы показывают себя в деле. В этой статье мы посмотрим на результаты экспериментов: какие техники оказались наиболее эффективными на датасете Natural Questions, где они приятно удивили, а где — наоборот, не оправдали ожиданий. Для оценки будем использовать фреймворк RAGAS , а также метрики BertScore и ROUGE-2 для анализа релевантности извлечённых чанков и финальных ответов. Поэтому впереди нас ждут эксперименты, цифры, наблюдения и (надеюсь) ценные инсайты, которые помогут вам не просто понять, какая техника кажется хорошей, а выбрать оптимальную под вашу задачу.

https://habr.com/ru/articles/949124/

#Rag #rag_техники #retrieval_augmented_generation #сравнение_rag_техник #ragas #bertscore #rouge

#rouge #bertscore #ragas #сравнение_rag_техник #retrieval_augmented_generation #rag_техники

Habr @[email protected] · 2025-09-21 · 16:52 UTC

Прокачиваем RAG: тестируем техники и считаем их эффективность. Часть 2

В прошлой части мы подробно разобрали 11 популярных техник RAG: как они устроены, какие у них есть сильные и слабые стороны, и в каких сценариях они могут быть полезны. Теперь пришло время перейти от теории к практике и посмотреть, как эти подходы показывают себя в деле. В этой статье мы посмотрим на результаты экспериментов: какие техники оказались наиболее эффективными на датасете Natural Questions, где они приятно удивили, а где — наоборот, не оправдали ожиданий. Для оценки будем использовать фреймворк RAGAS , а также метрики BertScore и ROUGE-2 для анализа релевантности извлечённых чанков и финальных ответов. Поэтому впереди нас ждут эксперименты, цифры, наблюдения и (надеюсь) ценные инсайты, которые помогут вам не просто понять, какая техника кажется хорошей, а выбрать оптимальную под вашу задачу.

https://habr.com/ru/articles/949124/

#Rag #rag_техники #retrieval_augmented_generation #сравнение_rag_техник #ragas #bertscore #rouge

#rouge #bertscore #ragas #сравнение_rag_техник #retrieval_augmented_generation #rag_техники

Habr @[email protected] · 2025-09-21 · 16:52 UTC

Прокачиваем RAG: тестируем техники и считаем их эффективность. Часть 2

В прошлой части мы подробно разобрали 11 популярных техник RAG: как они устроены, какие у них есть сильные и слабые стороны, и в каких сценариях они могут быть полезны. Теперь пришло время перейти от теории к практике и посмотреть, как эти подходы показывают себя в деле. В этой статье мы посмотрим на результаты экспериментов: какие техники оказались наиболее эффективными на датасете Natural Questions, где они приятно удивили, а где — наоборот, не оправдали ожиданий. Для оценки будем использовать фреймворк RAGAS , а также метрики BertScore и ROUGE-2 для анализа релевантности извлечённых чанков и финальных ответов. Поэтому впереди нас ждут эксперименты, цифры, наблюдения и (надеюсь) ценные инсайты, которые помогут вам не просто понять, какая техника кажется хорошей, а выбрать оптимальную под вашу задачу.

https://habr.com/ru/articles/949124/

#Rag #rag_техники #retrieval_augmented_generation #сравнение_rag_техник #ragas #bertscore #rouge

#rag #rag_техники #retrieval_augmented_generation #сравнение_rag_техник #ragas #bertscore

Habr @[email protected] · 2025-09-14 · 20:12 UTC

Прокачиваем RAG: тестируем техники и считаем их эффективность. Часть 1

При проектировании RAG-системы инженер каждый раз сталкивается со множеством вопросов: какую базу данных использовать, как организовать получение релевантной информации, да даже выбор эмбеддера может занять приличное время, а это лишь вершина айсберга. Что хорошо работает в одной сфере, например в техподдержке, может полностью провалиться в другой — например, при анализе юридических документов. Поэтому задачей инженера является выявление особенностей предметной области и адаптации RAG системы к ним. Однако, чтобы это сделать, необходимо не только понимать, какие приёмы можно использовать, но и знать насколько они эффективны. В данной статье мы разберём основные RAG техники, посмотрим их сильные и слабые стороны, сферы применения, а также немного поэкспериментируем. В следующей части статьи мы проведём тестирование этих техник на реальных пользовательских запросах из датасета Natural Questions и оценим качество работы с помощью RAGAS и BertScore, посмотрим на графики и разойдёмся, чтобы обдумать всё написанное. Поэтому предлагаю начать!

https://habr.com/ru/articles/946888/

#RAG #RAG_Техники #retrieval_augmented_generation #Сравнение_RAG_техник #bertscore #ragas

#rag #rag_техники #retrieval_augmented_generation #сравнение_rag_техник #bertscore #ragas

Habr @[email protected] · 2025-09-14 · 20:12 UTC

Прокачиваем RAG: тестируем техники и считаем их эффективность. Часть 1

При проектировании RAG-системы инженер каждый раз сталкивается со множеством вопросов: какую базу данных использовать, как организовать получение релевантной информации, да даже выбор эмбеддера может занять приличное время, а это лишь вершина айсберга. Что хорошо работает в одной сфере, например в техподдержке, может полностью провалиться в другой — например, при анализе юридических документов. Поэтому задачей инженера является выявление особенностей предметной области и адаптации RAG системы к ним. Однако, чтобы это сделать, необходимо не только понимать, какие приёмы можно использовать, но и знать насколько они эффективны. В данной статье мы разберём основные RAG техники, посмотрим их сильные и слабые стороны, сферы применения, а также немного поэкспериментируем. В следующей части статьи мы проведём тестирование этих техник на реальных пользовательских запросах из датасета Natural Questions и оценим качество работы с помощью RAGAS и BertScore, посмотрим на графики и разойдёмся, чтобы обдумать всё написанное. Поэтому предлагаю начать!

https://habr.com/ru/articles/946888/

#RAG #RAG_Техники #retrieval_augmented_generation #Сравнение_RAG_техник #bertscore #ragas

#rag #rag_техники #retrieval_augmented_generation #сравнение_rag_техник #bertscore #ragas

Habr @[email protected] · 2025-09-14 · 20:12 UTC

Прокачиваем RAG: тестируем техники и считаем их эффективность. Часть 1

При проектировании RAG-системы инженер каждый раз сталкивается со множеством вопросов: какую базу данных использовать, как организовать получение релевантной информации, да даже выбор эмбеддера может занять приличное время, а это лишь вершина айсберга. Что хорошо работает в одной сфере, например в техподдержке, может полностью провалиться в другой — например, при анализе юридических документов. Поэтому задачей инженера является выявление особенностей предметной области и адаптации RAG системы к ним. Однако, чтобы это сделать, необходимо не только понимать, какие приёмы можно использовать, но и знать насколько они эффективны. В данной статье мы разберём основные RAG техники, посмотрим их сильные и слабые стороны, сферы применения, а также немного поэкспериментируем. В следующей части статьи мы проведём тестирование этих техник на реальных пользовательских запросах из датасета Natural Questions и оценим качество работы с помощью RAGAS и BertScore, посмотрим на графики и разойдёмся, чтобы обдумать всё написанное. Поэтому предлагаю начать!

https://habr.com/ru/articles/946888/

#RAG #RAG_Техники #retrieval_augmented_generation #Сравнение_RAG_техник #bertscore #ragas

#ragas #bertscore #сравнение_rag_техник #retrieval_augmented_generation #rag_техники #rag

Habr @[email protected] · 2025-08-28 · 19:22 UTC

RAG и векторные БД: НЕ Сизифов LLM на Java и Spring Ai

Привет! Меня зовут Бромбин Андрей, и сегодня я разберу на практике, что такое RAG-системы и как они помогают улучшать поиск. Покажу, как использовать Spring AI, векторные базы данных и LLM. Ты получишь теорию и пример реализации на Java и Spring Boot – от идеи до работающего сервиса. Без сложных формул – только чёткие объяснения и код. Обновить резюме

https://habr.com/ru/companies/ruvds/articles/924100/

#spring_ai #исскуственный_интеллект #qdrant #semantic_search #retrieval_augmented_generation #vector_database #large_language_model #java #ruvds_статьи #космотекст

#spring_ai #исскуственный_интеллект #qdrant #semantic_search #retrieval_augmented_generation #vector_database

Habr @[email protected] · 2025-08-28 · 19:22 UTC

RAG и векторные БД: НЕ Сизифов LLM на Java и Spring Ai

Привет! Меня зовут Бромбин Андрей, и сегодня я разберу на практике, что такое RAG-системы и как они помогают улучшать поиск. Покажу, как использовать Spring AI, векторные базы данных и LLM. Ты получишь теорию и пример реализации на Java и Spring Boot – от идеи до работающего сервиса. Без сложных формул – только чёткие объяснения и код. Обновить резюме

https://habr.com/ru/companies/ruvds/articles/924100/

#spring_ai #исскуственный_интеллект #qdrant #semantic_search #retrieval_augmented_generation #vector_database #large_language_model #java #ruvds_статьи #космотекст

#spring_ai #исскуственный_интеллект #qdrant #semantic_search #retrieval_augmented_generation #vector_database

Habr @[email protected] · 2025-08-28 · 19:22 UTC

RAG и векторные БД: НЕ Сизифов LLM на Java и Spring Ai

Привет! Меня зовут Бромбин Андрей, и сегодня я разберу на практике, что такое RAG-системы и как они помогают улучшать поиск. Покажу, как использовать Spring AI, векторные базы данных и LLM. Ты получишь теорию и пример реализации на Java и Spring Boot – от идеи до работающего сервиса. Без сложных формул – только чёткие объяснения и код. Обновить резюме

https://habr.com/ru/companies/ruvds/articles/924100/

#spring_ai #исскуственный_интеллект #qdrant #semantic_search #retrieval_augmented_generation #vector_database #large_language_model #java #ruvds_статьи #космотекст

#космотекст #ruvds_статьи #java #large_language_model #vector_database #retrieval_augmented_generation

Habr @[email protected] · 2025-07-31 · 12:52 UTC

Retrieval-Augmented Generation (RAG): глубокий технический обзор

Retrieval-Augmented Generation (RAG) – это архитектурный подход к генеративным моделям, который сочетает навыки поиска информации с генеративными возможностями больших языковых моделей (LLM). Идея RAG была предложена в 2020 году, чтобы преодолеть ограничение LLM – замкнутость на знаниях из обучающих данных. Вместо попыток «вживить» все знания в параметры модели, RAG-подход позволяет модели запрашивать актуальные сведения из внешних источников (баз знаний) во время генерации ответа . Это обеспечивает более точные и актуальные ответы, опирающиеся на факты, а не только на память модели. В этой статье мы подробно рассмотрим : архитектуру RAG, её компоненты и этапы работы, современные инструменты и практики для реализации RAG, примеры кода на Python, кейсы применения в бизнесе и науке, технические вызовы и лучшие практики, сравнение RAG с классическим fine-tuning, перспективы технологии.

https://habr.com/ru/articles/931396/

#rag #retrieval_augmented_generation #llm #ai #rag_pipeline #rag_ai #finetuning #ragas

#ragas #finetuning #rag_ai #rag_pipeline #ai #llm

Habr @[email protected] · 2025-07-31 · 12:52 UTC

Retrieval-Augmented Generation (RAG): глубокий технический обзор

Retrieval-Augmented Generation (RAG) – это архитектурный подход к генеративным моделям, который сочетает навыки поиска информации с генеративными возможностями больших языковых моделей (LLM). Идея RAG была предложена в 2020 году, чтобы преодолеть ограничение LLM – замкнутость на знаниях из обучающих данных. Вместо попыток «вживить» все знания в параметры модели, RAG-подход позволяет модели запрашивать актуальные сведения из внешних источников (баз знаний) во время генерации ответа . Это обеспечивает более точные и актуальные ответы, опирающиеся на факты, а не только на память модели. В этой статье мы подробно рассмотрим : архитектуру RAG, её компоненты и этапы работы, современные инструменты и практики для реализации RAG, примеры кода на Python, кейсы применения в бизнесе и науке, технические вызовы и лучшие практики, сравнение RAG с классическим fine-tuning, перспективы технологии.

https://habr.com/ru/articles/931396/

#rag #retrieval_augmented_generation #llm #ai #rag_pipeline #rag_ai #finetuning #ragas

#ragas #finetuning #rag_ai #rag_pipeline #ai #llm

Habr @[email protected] · 2025-07-31 · 12:52 UTC

Retrieval-Augmented Generation (RAG): глубокий технический обзор

Retrieval-Augmented Generation (RAG) – это архитектурный подход к генеративным моделям, который сочетает навыки поиска информации с генеративными возможностями больших языковых моделей (LLM). Идея RAG была предложена в 2020 году, чтобы преодолеть ограничение LLM – замкнутость на знаниях из обучающих данных. Вместо попыток «вживить» все знания в параметры модели, RAG-подход позволяет модели запрашивать актуальные сведения из внешних источников (баз знаний) во время генерации ответа . Это обеспечивает более точные и актуальные ответы, опирающиеся на факты, а не только на память модели. В этой статье мы подробно рассмотрим : архитектуру RAG, её компоненты и этапы работы, современные инструменты и практики для реализации RAG, примеры кода на Python, кейсы применения в бизнесе и науке, технические вызовы и лучшие практики, сравнение RAG с классическим fine-tuning, перспективы технологии.

https://habr.com/ru/articles/931396/

#rag #retrieval_augmented_generation #llm #ai #rag_pipeline #rag_ai #finetuning #ragas

#rag #retrieval_augmented_generation #llm #ai #rag_pipeline #rag_ai

Habr @[email protected] · 2025-07-13 · 10:22 UTC

Свой ChatGPT на документах: делаем RAG с нуля

Всем привет! Наверняка у вас были ситуации, когда нужно быстро найти что-то в длинном документе-договоре, инструкции или отчёте. Сегодня я покажу, как сделать своего помощника, который будет отвечать на такие вопросы автоматически. Соберем RAG с нуля: загрузим документы, "нарежем" их на куски, проиндексируем в векторной базе данных Qdrant и подключим LLaMA. Если вы увидели незнакомые слова — не пугайтесь, далее я расскажу об этом подробно.

https://habr.com/ru/companies/amvera/articles/927138/

#rag #rag_ai #rag_pipeline #Retrieval_Augmented_Generation #ии_агент #ai_agent #ии_приложение #ai_app #ai_application #llama_33_70B

#rag #rag_ai #rag_pipeline #retrieval_augmented_generation #ии_агент #ai_agent

Habr @[email protected] · 2025-07-13 · 10:22 UTC

Свой ChatGPT на документах: делаем RAG с нуля

Всем привет! Наверняка у вас были ситуации, когда нужно быстро найти что-то в длинном документе-договоре, инструкции или отчёте. Сегодня я покажу, как сделать своего помощника, который будет отвечать на такие вопросы автоматически. Соберем RAG с нуля: загрузим документы, "нарежем" их на куски, проиндексируем в векторной базе данных Qdrant и подключим LLaMA. Если вы увидели незнакомые слова — не пугайтесь, далее я расскажу об этом подробно.

https://habr.com/ru/companies/amvera/articles/927138/

#rag #rag_ai #rag_pipeline #Retrieval_Augmented_Generation #ии_агент #ai_agent #ии_приложение #ai_app #ai_application #llama_33_70B

#rag #rag_ai #rag_pipeline #retrieval_augmented_generation #ии_агент #ai_agent

Habr @[email protected] · 2025-07-13 · 10:22 UTC

Свой ChatGPT на документах: делаем RAG с нуля

Всем привет! Наверняка у вас были ситуации, когда нужно быстро найти что-то в длинном документе-договоре, инструкции или отчёте. Сегодня я покажу, как сделать своего помощника, который будет отвечать на такие вопросы автоматически. Соберем RAG с нуля: загрузим документы, "нарежем" их на куски, проиндексируем в векторной базе данных Qdrant и подключим LLaMA. Если вы увидели незнакомые слова — не пугайтесь, далее я расскажу об этом подробно.

https://habr.com/ru/companies/amvera/articles/927138/

#rag #rag_ai #rag_pipeline #Retrieval_Augmented_Generation #ии_агент #ai_agent #ии_приложение #ai_app #ai_application #llama_33_70B

#llama_33_70b #ai_application #ai_app #ии_приложение #ai_agent #ии_агент

:rss: DevelopersIO @[email protected] · 2025-07-10 · 05:03 UTC

Amazon Bedrock: เปรียบเทียบระหว่าง "Kendra" และ "Bedrock Knowledge Bases" เมื่อใช้ RAG
https://dev.classmethod.jp/articles/comparing-kendra-and-bedrock-knowledge-bases-when-using-rag-th/

#dev_classmethod #Amazon_Bedrock #Amazon_Bedrock_Knowledge_Bases #Amazon_Kendra #RAG #Retrieval_Augmented_Generation #AWS #Classmethod_Thailand #Thai_Language

#dev_classmethod #amazon_bedrock #amazon_bedrock_knowledge_bases #amazon_kendra #rag #retrieval_augmented_generation

:rss: DevelopersIO @[email protected] · 2025-07-10 · 05:03 UTC

Amazon Bedrock: เปรียบเทียบระหว่าง "Kendra" และ "Bedrock Knowledge Bases" เมื่อใช้ RAG
https://dev.classmethod.jp/articles/comparing-kendra-and-bedrock-knowledge-bases-when-using-rag-th/

#dev_classmethod #Amazon_Bedrock #Amazon_Bedrock_Knowledge_Bases #Amazon_Kendra #RAG #Retrieval_Augmented_Generation #AWS #Classmethod_Thailand #Thai_Language

#dev_classmethod #amazon_bedrock #amazon_bedrock_knowledge_bases #amazon_kendra #rag #retrieval_augmented_generation

:rss: DevelopersIO @[email protected] · 2025-06-16 · 12:46 UTC

【登壇レポート】 JAWS-UG熊本で「今からでも間に合う！生成AI『RAG』再入門」と題して登壇しました！ #jawsug #jawsugkmmt
https://dev.classmethod.jp/articles/jawsug-kumamoto-20250614-aoyagi/

#dev_classmethod #JAWS_UG #Amazon_Bedrock #RAG #Retrieval_Augmented_Generation #生成AI #AWS

#jawsug #jawsugkmmt #dev_classmethod #jaws_ug #amazon_bedrock #rag

:rss: DevelopersIO @[email protected] · 2025-06-16 · 12:46 UTC

【登壇レポート】 JAWS-UG熊本で「今からでも間に合う！生成AI『RAG』再入門」と題して登壇しました！ #jawsug #jawsugkmmt
https://dev.classmethod.jp/articles/jawsug-kumamoto-20250614-aoyagi/

#dev_classmethod #JAWS_UG #Amazon_Bedrock #RAG #Retrieval_Augmented_Generation #生成AI #AWS

#jawsug #jawsugkmmt #dev_classmethod #jaws_ug #amazon_bedrock #rag

Habr @[email protected] · 2025-05-16 · 20:32 UTC

[Перевод] Часть 4. Обзор технологий RAG для LLM: аугментация извлеченных данных

Продолжаю адаптированный перевод статьи китайских исследователей Retrieval-Augmented Generation for Large Language Models: A Survey (ссылка на первую часть — здесь , на вторую часть — здесь , третью часть — здесь ). В этой, четвертой части авторы совсем скромненько, словно тренировались заполнять налоговую декларацию, разбирают технологии аугментации извлеченных данных. Поскольку без пояснительной бригады часть их информации оказалась для меня совершенной абракадаброй (напомню, я — переводчик, то бишь гуманитарий) , я не поленился пройтись по упомянутым авторами ссылочкам на исследования, взять оттуда схемки и картинки, и добавил их к этой части тоже. Надеюсь, с ними рассуждения и наблюдения авторов будут значительно прозрачнее. Поехали! Прочитать остальные буквы

https://habr.com/ru/articles/910162/

#языковые_модели #llm #llmмодели #llmприложения #llmагент #llmархитектура #rag #rag_pipeline #retrieval_augmented_generation #retrieval

#retrieval #retrieval_augmented_generation #rag_pipeline #rag #llmархитектура #llmагент

Habr @[email protected] · 2025-05-16 · 20:32 UTC

[Перевод] Часть 4. Обзор технологий RAG для LLM: аугментация извлеченных данных

Продолжаю адаптированный перевод статьи китайских исследователей Retrieval-Augmented Generation for Large Language Models: A Survey (ссылка на первую часть — здесь , на вторую часть — здесь , третью часть — здесь ). В этой, четвертой части авторы совсем скромненько, словно тренировались заполнять налоговую декларацию, разбирают технологии аугментации извлеченных данных. Поскольку без пояснительной бригады часть их информации оказалась для меня совершенной абракадаброй (напомню, я — переводчик, то бишь гуманитарий) , я не поленился пройтись по упомянутым авторами ссылочкам на исследования, взять оттуда схемки и картинки, и добавил их к этой части тоже. Надеюсь, с ними рассуждения и наблюдения авторов будут значительно прозрачнее. Поехали! Прочитать остальные буквы

https://habr.com/ru/articles/910162/

#языковые_модели #llm #llmмодели #llmприложения #llmагент #llmархитектура #rag #rag_pipeline #retrieval_augmented_generation #retrieval

#retrieval #retrieval_augmented_generation #rag_pipeline #rag #llmархитектура #llmагент

Habr @[email protected] · 2025-05-16 · 20:32 UTC

[Перевод] Часть 4. Обзор технологий RAG для LLM: аугментация извлеченных данных

Продолжаю адаптированный перевод статьи китайских исследователей Retrieval-Augmented Generation for Large Language Models: A Survey (ссылка на первую часть — здесь , на вторую часть — здесь , третью часть — здесь ). В этой, четвертой части авторы совсем скромненько, словно тренировались заполнять налоговую декларацию, разбирают технологии аугментации извлеченных данных. Поскольку без пояснительной бригады часть их информации оказалась для меня совершенной абракадаброй (напомню, я — переводчик, то бишь гуманитарий) , я не поленился пройтись по упомянутым авторами ссылочкам на исследования, взять оттуда схемки и картинки, и добавил их к этой части тоже. Надеюсь, с ними рассуждения и наблюдения авторов будут значительно прозрачнее. Поехали! Прочитать остальные буквы

https://habr.com/ru/articles/910162/

#языковые_модели #llm #llmмодели #llmприложения #llmагент #llmархитектура #rag #rag_pipeline #retrieval_augmented_generation #retrieval

#языковые_модели #llm #llmмодели #llmприложения #llmагент #llmархитектура

:rss: DevelopersIO @[email protected] · 2025-04-18 · 00:42 UTC

日本語に強くローカルで動作！テキスト埋め込みモデルPLaMo-Embedding-1Bを試してみた
https://dev.classmethod.jp/articles/shuntaka-try-plamo-embedding-1b/

#dev_classmethod #生成AI #Retrieval_Augmented_Generation

#dev_classmethod #生成ai #retrieval_augmented_generation

:rss: DevelopersIO @[email protected] · 2025-04-18 · 00:42 UTC

日本語に強くローカルで動作！テキスト埋め込みモデルPLaMo-Embedding-1Bを試してみた
https://dev.classmethod.jp/articles/shuntaka-try-plamo-embedding-1b/

#dev_classmethod #生成AI #Retrieval_Augmented_Generation

#dev_classmethod #生成ai #retrieval_augmented_generation

:rss: DevelopersIO @[email protected] · 2025-04-10 · 10:46 UTC

วิธีตั้งค่าการจำกัด IP สำหรับ GenU
https://dev.classmethod.jp/articles/how-to-set-ip-restrictions-for-genu/

#dev_classmethod #Classmethod_Thailand #Retrieval_Augmented_Generation #Amazon_Bedrock #AI #AWS

#dev_classmethod #classmethod_thailand #retrieval_augmented_generation #amazon_bedrock #ai #aws

:rss: DevelopersIO @[email protected] · 2025-04-10 · 10:46 UTC

วิธีตั้งค่าการจำกัด IP สำหรับ GenU
https://dev.classmethod.jp/articles/how-to-set-ip-restrictions-for-genu/

#dev_classmethod #Classmethod_Thailand #Retrieval_Augmented_Generation #Amazon_Bedrock #AI #AWS

#dev_classmethod #classmethod_thailand #retrieval_augmented_generation #amazon_bedrock #ai #aws

:rss: DevelopersIO @[email protected] · 2025-04-09 · 07:29 UTC

วิธีตั้งค่า Hostname ก่อน Deploy GenU
https://dev.classmethod.jp/articles/how-to-set-hostname-before-deploy-genu/

#dev_classmethod #Classmethod_Thailand #Retrieval_Augmented_Generation #Amazon_Bedrock #AI #AWS

#dev_classmethod #classmethod_thailand #retrieval_augmented_generation #amazon_bedrock #ai #aws

:rss: DevelopersIO @[email protected] · 2025-04-09 · 07:29 UTC

วิธีตั้งค่า Hostname ก่อน Deploy GenU
https://dev.classmethod.jp/articles/how-to-set-hostname-before-deploy-genu/

#dev_classmethod #Classmethod_Thailand #Retrieval_Augmented_Generation #Amazon_Bedrock #AI #AWS

#dev_classmethod #classmethod_thailand #retrieval_augmented_generation #amazon_bedrock #ai #aws

Habr @[email protected] · 2025-03-22 · 12:02 UTC

Как я победил в RAG Challenge: от нуля до SoTA за один конкурс

Когда новичок пытается построить свою первую вопросно-ответную LLM систему, он быстро узнаёт, что базовый RAG - это для малышей и его нужно "прокачивать" модными техниками: Hybrid Search, Parent Document Retrieval, Reranking и десятки других непонятных терминов. Глаза разбегаются, наступает паралич выбора, ладошки потеют. А что, если попробовать их все? Я решил потратить на подготовку к соревнованию 200+ часов и собственноручно проверить каждую из этих методик. Получилось настолько удачно, что я выиграл конкурс во всех номинациях. Теперь рассказываю, какие техники оказались полезными, а какие нет, и как повторить мой результат.

https://habr.com/ru/articles/893356/

#RAG #Docling #векторный_поиск #retrieval_augmented_generation #question_answering #LLM #FAISS #GPT #ChatGPT #парсинг_PDF

#парсинг_pdf #chatgpt #gpt #faiss #llm #question_answering

Habr @[email protected] · 2025-03-22 · 12:02 UTC

Как я победил в RAG Challenge: от нуля до SoTA за один конкурс

Когда новичок пытается построить свою первую вопросно-ответную LLM систему, он быстро узнаёт, что базовый RAG - это для малышей и его нужно "прокачивать" модными техниками: Hybrid Search, Parent Document Retrieval, Reranking и десятки других непонятных терминов. Глаза разбегаются, наступает паралич выбора, ладошки потеют. А что, если попробовать их все? Я решил потратить на подготовку к соревнованию 200+ часов и собственноручно проверить каждую из этих методик. Получилось настолько удачно, что я выиграл конкурс во всех номинациях. Теперь рассказываю, какие техники оказались полезными, а какие нет, и как повторить мой результат.

https://habr.com/ru/articles/893356/

#RAG #Docling #векторный_поиск #retrieval_augmented_generation #question_answering #LLM #FAISS #GPT #ChatGPT #парсинг_PDF

#парсинг_pdf #chatgpt #gpt #faiss #llm #question_answering