#retrieval_augmented_generation — Public Fediverse posts
Live and recent posts from across the Fediverse tagged #retrieval_augmented_generation, aggregated by home.social.
-
10 актуальных RAG-подходов: какие реально полезны и когда их применять?
Всем привет, на фоне обновлений в LLM-стеке за последний год, решил собрать практический список RAG-подходов, которые реально используются в продакшене на основе моего опыта и того что я изучал в других кейсах.
https://habr.com/ru/articles/1029616/
#aiразработка #rag_ai #rag_pipeline #retrieval_augmented_generation #llm #llmмодели #vector_search #hybrid_search #graphrag #multimodal
-
Книга: «Основы GraphRAG. Улучшенный RAG на базе графов знаний»
Привет, Хабожители! Создайте и разверните систему GraphRAG производственного уровня. Научитесь извлекать структурированные знания из текста и комбинировать методы векторного поиска с поиском по графам. Книга богата практическими примерами: от создания инструмента поиска по векторному сходству и приложения Agentic RAG до оценки эффективности и точности результатов работы такого приложения.
-
Как помочь вашему RAG адаптироваться? Принимайте DRAG with KNEE! Часть 1
Все мы проходили через это: скармливаешь RAG‑системе сложный PDF на 50 страниц, а она в ответ либо галлюцинирует, либо вываливает на LLM простыню нерелевантного текста, съедая ваш бюджет на токены быстрее, чем вы успеваете сказать «GPT-4o». Проблема в том, что классический подход со статическим top_k — это костыль, который либо не додает контекста, либо вызывает у модели информационное «ожирение» (заполняет контекст нерелевантным мусором). Нашему RAG нужно помочь адаптироваться к безжалостной среде разрозненных документов! Я потратил выходные на то, чтобы решить эту проблему фундаментально. В итоге на свет появился DRAG with KNEE (Dynamic RAG with Knee‑point pruning) — алгоритм, который не просто ищет «похожее», а выстраивает иерархию документов и безжалостно отсекает лишнее с помощью геометрического анализа «колена». В этой статье я покажу, как с помощью Qdrant, Python и капли математики сделать ваш RAG адаптивным. Читать далее?
https://habr.com/ru/articles/1016438/
#rag #knee #hierarchical_structure #optimization #retrieval_augmented_generation
-
От 0.034 до 0.791 и обратно: Legal RAG, 17 итераций и стена масштабирования
Я участвовал в ARLC 2026 — юридическом AI-челлендже по построению RAG-пайплайна поверх корпуса судебных решений и законов. Соло, с Claude Code в качестве напарника. За 5 дней и 17 итераций прошёл путь от 0.034 до 0.791 на warmup — а потом вышел в финал и потерял 42% на 300 документах вместо 30. Внутри — архитектура, код, математика F-beta, три провала и честный разбор работы с AI-ассистентом.
https://habr.com/ru/articles/1014758/
#RAG #retrieval_augmented_generation #legal_AI #Claude #grounding #BM25 #reranking #NLP #соревнование
-
От 0.034 до 0.791 и обратно: Legal RAG, 17 итераций и стена масштабирования
Я участвовал в ARLC 2026 — юридическом AI-челлендже по построению RAG-пайплайна поверх корпуса судебных решений и законов. Соло, с Claude Code в качестве напарника. За 5 дней и 17 итераций прошёл путь от 0.034 до 0.791 на warmup — а потом вышел в финал и потерял 42% на 300 документах вместо 30. Внутри — архитектура, код, математика F-beta, три провала и честный разбор работы с AI-ассистентом.
https://habr.com/ru/articles/1014758/
#RAG #retrieval_augmented_generation #legal_AI #Claude #grounding #BM25 #reranking #NLP #соревнование
-
От 0.034 до 0.791 и обратно: Legal RAG, 17 итераций и стена масштабирования
Я участвовал в ARLC 2026 — юридическом AI-челлендже по построению RAG-пайплайна поверх корпуса судебных решений и законов. Соло, с Claude Code в качестве напарника. За 5 дней и 17 итераций прошёл путь от 0.034 до 0.791 на warmup — а потом вышел в финал и потерял 42% на 300 документах вместо 30. Внутри — архитектура, код, математика F-beta, три провала и честный разбор работы с AI-ассистентом.
https://habr.com/ru/articles/1014758/
#RAG #retrieval_augmented_generation #legal_AI #Claude #grounding #BM25 #reranking #NLP #соревнование
-
От 0.034 до 0.791 и обратно: Legal RAG, 17 итераций и стена масштабирования
Я участвовал в ARLC 2026 — юридическом AI-челлендже по построению RAG-пайплайна поверх корпуса судебных решений и законов. Соло, с Claude Code в качестве напарника. За 5 дней и 17 итераций прошёл путь от 0.034 до 0.791 на warmup — а потом вышел в финал и потерял 42% на 300 документах вместо 30. Внутри — архитектура, код, математика F-beta, три провала и честный разбор работы с AI-ассистентом.
https://habr.com/ru/articles/1014758/
#RAG #retrieval_augmented_generation #legal_AI #Claude #grounding #BM25 #reranking #NLP #соревнование
-
Generative AI for Beginners .NET: Version 2 on .NET 10
https://devblogs.microsoft.com/dotnet/generative-ai-for-beginners-dotnet-version-2-on-dotnet-10/#microsoft #NET #NET_Aspire #NET_Fundamentals #AI #C #Cloud #NET_10 #agent_framework #ai_course #generative_ai #Microsoft_Extensions_AI #retrieval_augmented_generation
-
Generative AI for Beginners .NET: Version 2 on .NET 10
https://devblogs.microsoft.com/dotnet/generative-ai-for-beginners-dotnet-version-2-on-dotnet-10/#microsoft #NET #NET_Aspire #NET_Fundamentals #AI #C #Cloud #NET_10 #agent_framework #ai_course #generative_ai #Microsoft_Extensions_AI #retrieval_augmented_generation
-
Generative AI for Beginners .NET: Version 2 on .NET 10
https://devblogs.microsoft.com/dotnet/generative-ai-for-beginners-dotnet-version-2-on-dotnet-10/#microsoft #NET #NET_Aspire #NET_Fundamentals #AI #C #Cloud #NET_10 #agent_framework #ai_course #generative_ai #Microsoft_Extensions_AI #retrieval_augmented_generation
-
RAG на PHP + Qdrant: быстрый MVP для внутренней базы знаний
RAG на PHP - звучит непривычно. Делюсь опытом построения чат-бота для поиска по внутренней базе документов: Symfony, Qdrant с гибридным поиском, YandexGPT для embedding и генерации ответов. Внутри — готовый код, подводные камни чанкинга и советы, которые сэкономят вам время.
https://habr.com/ru/articles/1001156/
#rag #retrieval_augmented_generation #llm #qdrant #yandexgpt #php #rag_pipeline #neuron
-
Прокачиваем RAG: тестируем техники и считаем их эффективность. Часть 2
В прошлой части мы подробно разобрали 11 популярных техник RAG: как они устроены, какие у них есть сильные и слабые стороны, и в каких сценариях они могут быть полезны. Теперь пришло время перейти от теории к практике и посмотреть, как эти подходы показывают себя в деле. В этой статье мы посмотрим на результаты экспериментов: какие техники оказались наиболее эффективными на датасете Natural Questions, где они приятно удивили, а где — наоборот, не оправдали ожиданий. Для оценки будем использовать фреймворк RAGAS , а также метрики BertScore и ROUGE-2 для анализа релевантности извлечённых чанков и финальных ответов. Поэтому впереди нас ждут эксперименты, цифры, наблюдения и (надеюсь) ценные инсайты, которые помогут вам не просто понять, какая техника кажется хорошей, а выбрать оптимальную под вашу задачу.
https://habr.com/ru/articles/949124/
#Rag #rag_техники #retrieval_augmented_generation #сравнение_rag_техник #ragas #bertscore #rouge
-
Прокачиваем RAG: тестируем техники и считаем их эффективность. Часть 1
При проектировании RAG-системы инженер каждый раз сталкивается со множеством вопросов: какую базу данных использовать, как организовать получение релевантной информации, да даже выбор эмбеддера может занять приличное время, а это лишь вершина айсберга. Что хорошо работает в одной сфере, например в техподдержке, может полностью провалиться в другой — например, при анализе юридических документов. Поэтому задачей инженера является выявление особенностей предметной области и адаптации RAG системы к ним. Однако, чтобы это сделать, необходимо не только понимать, какие приёмы можно использовать, но и знать насколько они эффективны. В данной статье мы разберём основные RAG техники, посмотрим их сильные и слабые стороны, сферы применения, а также немного поэкспериментируем. В следующей части статьи мы проведём тестирование этих техник на реальных пользовательских запросах из датасета Natural Questions и оценим качество работы с помощью RAGAS и BertScore, посмотрим на графики и разойдёмся, чтобы обдумать всё написанное. Поэтому предлагаю начать!
https://habr.com/ru/articles/946888/
#RAG #RAG_Техники #retrieval_augmented_generation #Сравнение_RAG_техник #bertscore #ragas
-
RAG и векторные БД: НЕ Сизифов LLM на Java и Spring Ai
Привет! Меня зовут Бромбин Андрей, и сегодня я разберу на практике, что такое RAG-системы и как они помогают улучшать поиск. Покажу, как использовать Spring AI, векторные базы данных и LLM. Ты получишь теорию и пример реализации на Java и Spring Boot – от идеи до работающего сервиса. Без сложных формул – только чёткие объяснения и код. Обновить резюме
https://habr.com/ru/companies/ruvds/articles/924100/
#spring_ai #исскуственный_интеллект #qdrant #semantic_search #retrieval_augmented_generation #vector_database #large_language_model #java #ruvds_статьи #космотекст
-
Retrieval-Augmented Generation (RAG): глубокий технический обзор
Retrieval-Augmented Generation (RAG) – это архитектурный подход к генеративным моделям, который сочетает навыки поиска информации с генеративными возможностями больших языковых моделей (LLM). Идея RAG была предложена в 2020 году, чтобы преодолеть ограничение LLM – замкнутость на знаниях из обучающих данных. Вместо попыток «вживить» все знания в параметры модели, RAG-подход позволяет модели запрашивать актуальные сведения из внешних источников (баз знаний) во время генерации ответа . Это обеспечивает более точные и актуальные ответы, опирающиеся на факты, а не только на память модели. В этой статье мы подробно рассмотрим : архитектуру RAG, её компоненты и этапы работы, современные инструменты и практики для реализации RAG, примеры кода на Python, кейсы применения в бизнесе и науке, технические вызовы и лучшие практики, сравнение RAG с классическим fine-tuning, перспективы технологии.
https://habr.com/ru/articles/931396/
#rag #retrieval_augmented_generation #llm #ai #rag_pipeline #rag_ai #finetuning #ragas
-
Свой ChatGPT на документах: делаем RAG с нуля
Всем привет! Наверняка у вас были ситуации, когда нужно быстро найти что-то в длинном документе-договоре, инструкции или отчёте. Сегодня я покажу, как сделать своего помощника, который будет отвечать на такие вопросы автоматически. Соберем RAG с нуля: загрузим документы, "нарежем" их на куски, проиндексируем в векторной базе данных Qdrant и подключим LLaMA. Если вы увидели незнакомые слова — не пугайтесь, далее я расскажу об этом подробно.
https://habr.com/ru/companies/amvera/articles/927138/
#rag #rag_ai #rag_pipeline #Retrieval_Augmented_Generation #ии_агент #ai_agent #ии_приложение #ai_app #ai_application #llama_33_70B
-
Amazon Bedrock: เปรียบเทียบระหว่าง "Kendra" และ "Bedrock Knowledge Bases" เมื่อใช้ RAG
https://dev.classmethod.jp/articles/comparing-kendra-and-bedrock-knowledge-bases-when-using-rag-th/#dev_classmethod #Amazon_Bedrock #Amazon_Bedrock_Knowledge_Bases #Amazon_Kendra #RAG #Retrieval_Augmented_Generation #AWS #Classmethod_Thailand #Thai_Language
-
【登壇レポート】 JAWS-UG熊本で「今からでも間に合う! 生成AI『RAG』再入門」と題して登壇しました! #jawsug #jawsugkmmt
https://dev.classmethod.jp/articles/jawsug-kumamoto-20250614-aoyagi/#dev_classmethod #JAWS_UG #Amazon_Bedrock #RAG #Retrieval_Augmented_Generation #生成AI #AWS
-
Как я победил в RAG Challenge: от нуля до SoTA за один конкурс
Когда новичок пытается построить свою первую вопросно-ответную LLM систему, он быстро узнаёт, что базовый RAG - это для малышей и его нужно "прокачивать" модными техниками: Hybrid Search, Parent Document Retrieval, Reranking и десятки других непонятных терминов. Глаза разбегаются, наступает паралич выбора, ладошки потеют. А что, если попробовать их все? Я решил потратить на подготовку к соревнованию 200+ часов и собственноручно проверить каждую из этих методик. Получилось настолько удачно, что я выиграл конкурс во всех номинациях. Теперь рассказываю, какие техники оказались полезными, а какие нет, и как повторить мой результат.
https://habr.com/ru/articles/893356/
#RAG #Docling #векторный_поиск #retrieval_augmented_generation #question_answering #LLM #FAISS #GPT #ChatGPT #парсинг_PDF
-
วิธีเพิ่มและลบ User ใน User Management ของ Cognito ที่ตั้งค่าไว้สำหรับ GenU
https://dev.classmethod.jp/articles/genu-user-management-with-cognito-th/#dev_classmethod #Classmethod_Thailand #Amazon_Cognito #Retrieval_Augmented_Generation #AWS #AI #Thai_Language
-
[Amazon Bedrock] RAG利用時の選択肢「Kendra」と「Bedrock Knowledge Bases」を比較する
https://dev.classmethod.jp/articles/comparing-kendra-and-bedrock-knowledge-bases-when-using-rag/#dev_classmethod #Amazon_Bedrock #Amazon_Bedrock_Knowledge_Bases #Amazon_Kendra #RAG #Retrieval_Augmented_Generation #生成AI #AWS
-
Построение надёжных систем из ненадёжных агентов
Большие языковые модели можно применять для разных практических целей. Одно из самых интересных направлений — это автономные AI-агенты. Если сгенерировать большое количество агентов по заданному запросу и заставить их конкурировать друг с другом, то теоретически можно получить оптимальный результат по данной проблеме. Это можно использовать и в информационной безопасности, и в других сферах программной разработки. Кроме того, можно создавать агентов, то есть софт, который самостоятельно эволюционирует и улучшает себя на базе обратной связи от пользователей.
https://habr.com/ru/companies/globalsign/articles/822169/
#агенты #overkiLLM #ollama #LLM #DAG #DAGWorks #Burr #AIагенты #надёжность #Retrieval_Augmented_Generation #RAG #Instructor #prompt_engineering #openllmetry #openinference #OpenTelemetry #pgvector #RAGatouille
-
Векторные БД vs Точность — часть 2
В первой части из тестов стало понятно, что в векторном поиске с терминами что-то не так. И точность достаточно низкая для корректной работы RAG (retrieval augmentation generation). Давайте попробуем гибридный поиск и посмотрим, что из этого получится.
https://habr.com/ru/articles/817173/
#llm #векторные_базы_данных #retrieval_augmented_generation #chroma #weaviate #qdrant
-
Векторные БД vs Точность — часть 1
Как я пытался собрать "по-быстрому" локальный RAG(retrieval augmentation generation), который будет находить термины из словаря Ожегова и поделиться об этом тут. На просторах интернетах все просто. Но на практике для моей задачи это оказалось не так. Точность...
https://habr.com/ru/articles/807957/
#llm #векторные_базы_данных #retrieval_augmented_generation #chromadb
-
Claude3とAzure AI Document Intelligenceを使ってドキュメント読み取りの精度をあげてみた
https://dev.classmethod.jp/articles/fix-claude3-text-recognition-mistake-with-azure-document-intelligence/#dev_classmethod #Retrieval_Augmented_Generation #RAG #OpenAI #ChatGPT #AWS #情報検索 #Amazon_Kendra #Anthropic #Claude #生成AI #チャットボット #業務効率化 #Microsoft_Azure #Azure_Document_intelligence