#эмбеддинги — Public Fediverse posts on home.social

Habr @[email protected] · 2026-05-28 · 11:12 UTC

Прокачать SQLite и сократить векторы в видеоформате — открытые инструменты для работы с эмбеддингами

Мы в

https://habr.com/ru/companies/beeline_cloud/articles/1040100/

#beeline_cloud #векторные_представления #векторные_субд #эмбеддинги #анализ_текста

#анализ_текста #эмбеддинги #векторные_субд #векторные_представления #beeline_cloud

Habr @[email protected] · 2026-05-25 · 13:52 UTC

Защита от дублирования кода агентами: семантические концепции

Я строю Telegram-first SaaS в одиночку, а весь код за меня пишут ИИ-агенты Claude Code, и довольно быстро я уперся в неприятное: каждый новый агент приходит на работу с чистой памятью, не находит уже написанное, грепает по выдуманным именам и пишет свою реализацию заново - так за неделю в репозитории набегает +65К -1.5К строк, а устоявшиеся паттерны тихо расходятся. Это третья статья серии про разработку руками агентов, и в ней - честный разбор того, как я строил для своей команды из амнезиков слой памяти о коде. Почему клоны от ИИ это в основном Type-4, которые токенные детекторы попросту не видят; почему векторная база здесь неправильный основной фикс; как граф концептов на локальной модели лег почти один-в-один на когнитивную науку о человеческой памяти (Тульвинг, Вегнер, Спэрроу); и как на одном страшном отрицательном результате я чуть не усложнил себе архитектуру ради проблемы, которая решалась переписыванием одного абзаца. С тупиками, цифрами и слепым A/B-тестом, без срезанных углов. Вспомнить всё

https://habr.com/ru/articles/1039124/

#ИИагенты #Claude_Code #дедупликация_кода #граф_концептов #эмбеддинги #семантический_поиск #Type4_клоны #retrieval #DRY #память
__агентов

#память #dry #retrieval #type4_клоны #семантический_поиск #эмбеддинги

Habr @[email protected] · 2026-05-25 · 13:52 UTC

Защита от дублирования кода агентами: семантические концепции

Я строю Telegram-first SaaS в одиночку, а весь код за меня пишут ИИ-агенты Claude Code, и довольно быстро я уперся в неприятное: каждый новый агент приходит на работу с чистой памятью, не находит уже написанное, грепает по выдуманным именам и пишет свою реализацию заново - так за неделю в репозитории набегает +65К -1.5К строк, а устоявшиеся паттерны тихо расходятся. Это третья статья серии про разработку руками агентов, и в ней - честный разбор того, как я строил для своей команды из амнезиков слой памяти о коде. Почему клоны от ИИ это в основном Type-4, которые токенные детекторы попросту не видят; почему векторная база здесь неправильный основной фикс; как граф концептов на локальной модели лег почти один-в-один на когнитивную науку о человеческой памяти (Тульвинг, Вегнер, Спэрроу); и как на одном страшном отрицательном результате я чуть не усложнил себе архитектуру ради проблемы, которая решалась переписыванием одного абзаца. С тупиками, цифрами и слепым A/B-тестом, без срезанных углов. Вспомнить всё

https://habr.com/ru/articles/1039124/

#ИИагенты #Claude_Code #дедупликация_кода #граф_концептов #эмбеддинги #семантический_поиск #Type4_клоны #retrieval #DRY #память
__агентов

#память #dry #retrieval #type4_клоны #семантический_поиск #эмбеддинги

Habr @[email protected] · 2026-05-25 · 13:52 UTC

Защита от дублирования кода агентами: семантические концепции

Я строю Telegram-first SaaS в одиночку, а весь код за меня пишут ИИ-агенты Claude Code, и довольно быстро я уперся в неприятное: каждый новый агент приходит на работу с чистой памятью, не находит уже написанное, грепает по выдуманным именам и пишет свою реализацию заново - так за неделю в репозитории набегает +65К -1.5К строк, а устоявшиеся паттерны тихо расходятся. Это третья статья серии про разработку руками агентов, и в ней - честный разбор того, как я строил для своей команды из амнезиков слой памяти о коде. Почему клоны от ИИ это в основном Type-4, которые токенные детекторы попросту не видят; почему векторная база здесь неправильный основной фикс; как граф концептов на локальной модели лег почти один-в-один на когнитивную науку о человеческой памяти (Тульвинг, Вегнер, Спэрроу); и как на одном страшном отрицательном результате я чуть не усложнил себе архитектуру ради проблемы, которая решалась переписыванием одного абзаца. С тупиками, цифрами и слепым A/B-тестом, без срезанных углов. Вспомнить всё

https://habr.com/ru/articles/1039124/

#ИИагенты #Claude_Code #дедупликация_кода #граф_концептов #эмбеддинги #семантический_поиск #Type4_клоны #retrieval #DRY #память
__агентов

#память #dry #retrieval #type4_клоны #семантический_поиск #эмбеддинги

Habr @[email protected] · 2026-05-25 · 13:52 UTC

Защита от дублирования кода агентами: семантические концепции

Я строю Telegram-first SaaS в одиночку, а весь код за меня пишут ИИ-агенты Claude Code, и довольно быстро я уперся в неприятное: каждый новый агент приходит на работу с чистой памятью, не находит уже написанное, грепает по выдуманным именам и пишет свою реализацию заново - так за неделю в репозитории набегает +65К -1.5К строк, а устоявшиеся паттерны тихо расходятся. Это третья статья серии про разработку руками агентов, и в ней - честный разбор того, как я строил для своей команды из амнезиков слой памяти о коде. Почему клоны от ИИ это в основном Type-4, которые токенные детекторы попросту не видят; почему векторная база здесь неправильный основной фикс; как граф концептов на локальной модели лег почти один-в-один на когнитивную науку о человеческой памяти (Тульвинг, Вегнер, Спэрроу); и как на одном страшном отрицательном результате я чуть не усложнил себе архитектуру ради проблемы, которая решалась переписыванием одного абзаца. С тупиками, цифрами и слепым A/B-тестом, без срезанных углов. Вспомнить всё

https://habr.com/ru/articles/1039124/

#ИИагенты #Claude_Code #дедупликация_кода #граф_концептов #эмбеддинги #семантический_поиск #Type4_клоны #retrieval #DRY #память
__агентов

#ииагенты #claude_code #дедупликация_кода #граф_концептов #эмбеддинги #семантический_поиск

Habr @[email protected] · 2026-05-25 · 07:52 UTC

RAG в энтерпрайзе: почему демо работает, а прод нет

Представьте себе типичное совещание. Кто-то из руководства возвращается с конференции, садится напротив и говорит: «У них там бот по внутренней документации, надо себе такой же. До конца квартала». Через четыре месяца у тебя есть Pinecone, OpenAI API, две недели работы над парсингом PDF и чат-бот, который на демо отвечает на пять подобранных вопросов идеально. А на шестой, который задаст любой нормальный сотрудник, отвечает уверенным бредом. Дальше про то, что именно между этими двумя состояниями происходит. Но без «правильной архитектуры RAG», потому что такой не существует.

https://habr.com/ru/articles/1038670/

#RAG #LLM #retrievalaugmented_generation #векторные_базы_данных #эмбеддинги #чанкинг #корпоративный_поиск #галлюцинации_LLM #OpenAI #Pinecone

#pinecone #openai #галлюцинации_llm #корпоративный_поиск #чанкинг #эмбеддинги

Habr @[email protected] · 2026-05-25 · 07:52 UTC

RAG в энтерпрайзе: почему демо работает, а прод нет

Представьте себе типичное совещание. Кто-то из руководства возвращается с конференции, садится напротив и говорит: «У них там бот по внутренней документации, надо себе такой же. До конца квартала». Через четыре месяца у тебя есть Pinecone, OpenAI API, две недели работы над парсингом PDF и чат-бот, который на демо отвечает на пять подобранных вопросов идеально. А на шестой, который задаст любой нормальный сотрудник, отвечает уверенным бредом. Дальше про то, что именно между этими двумя состояниями происходит. Но без «правильной архитектуры RAG», потому что такой не существует.

https://habr.com/ru/articles/1038670/

#RAG #LLM #retrievalaugmented_generation #векторные_базы_данных #эмбеддинги #чанкинг #корпоративный_поиск #галлюцинации_LLM #OpenAI #Pinecone

#pinecone #openai #галлюцинации_llm #корпоративный_поиск #чанкинг #эмбеддинги

Habr @[email protected] · 2026-05-25 · 07:52 UTC

RAG в энтерпрайзе: почему демо работает, а прод нет

Представьте себе типичное совещание. Кто-то из руководства возвращается с конференции, садится напротив и говорит: «У них там бот по внутренней документации, надо себе такой же. До конца квартала». Через четыре месяца у тебя есть Pinecone, OpenAI API, две недели работы над парсингом PDF и чат-бот, который на демо отвечает на пять подобранных вопросов идеально. А на шестой, который задаст любой нормальный сотрудник, отвечает уверенным бредом. Дальше про то, что именно между этими двумя состояниями происходит. Но без «правильной архитектуры RAG», потому что такой не существует.

https://habr.com/ru/articles/1038670/

#RAG #LLM #retrievalaugmented_generation #векторные_базы_данных #эмбеддинги #чанкинг #корпоративный_поиск #галлюцинации_LLM #OpenAI #Pinecone

#pinecone #openai #галлюцинации_llm #корпоративный_поиск #чанкинг #эмбеддинги

Habr @[email protected] · 2026-05-25 · 07:52 UTC

RAG в энтерпрайзе: почему демо работает, а прод нет

Представьте себе типичное совещание. Кто-то из руководства возвращается с конференции, садится напротив и говорит: «У них там бот по внутренней документации, надо себе такой же. До конца квартала». Через четыре месяца у тебя есть Pinecone, OpenAI API, две недели работы над парсингом PDF и чат-бот, который на демо отвечает на пять подобранных вопросов идеально. А на шестой, который задаст любой нормальный сотрудник, отвечает уверенным бредом. Дальше про то, что именно между этими двумя состояниями происходит. Но без «правильной архитектуры RAG», потому что такой не существует.

https://habr.com/ru/articles/1038670/

#RAG #LLM #retrievalaugmented_generation #векторные_базы_данных #эмбеддинги #чанкинг #корпоративный_поиск #галлюцинации_LLM #OpenAI #Pinecone

#rag #llm #retrievalaugmented_generation #векторные_базы_данных #эмбеддинги #чанкинг

Habr @[email protected] · 2026-05-21 · 18:52 UTC

Надо ли бороться с анизотропией эмбеддингов

Анизотропия эмбеддингов не всегда зло, но «сырой» косинус часто даёт слишком размытый сигнал. Центрирование убирает общий фон и помогает увидеть различия, не разрушая локальные смысловые области. Показываю это на реальных расчётах из Obsidian‑базы.

https://habr.com/ru/articles/1037906/

#эмбеддинги #анизотропия_эмбеддингов #база_знаний #векторный_поиск #калибровка_эмбедингов #косинусное_сходство

#косинусное_сходство #калибровка_эмбедингов #векторный_поиск #база_знаний #анизотропия_эмбеддингов #эмбеддинги

Habr @[email protected] · 2026-05-21 · 13:42 UTC

Вам продают ИИ. Покупать нужно не его

Звонил мне на днях один знакомый CIO. Питерский, ритейл, средний бизнес, ничего особенного. Слушай, говорит, надо нам с ИИ что-то делать: все вокруг внедряют, конкуренты вон что-то запустили, на отраслевом Data Summit уши прожужжали, а у меня даже плана нет. И денег, кстати, особо на это не выделили, но не суть. Это был, кажется, пятый такой звонок за месяц. И знаете, что меня в них всех поражает? Спрашивают они одно и то же, и спрашивают неправильно. Не «нужен ли нам ИИ», а «куда бежать, чтобы не опоздать», - разница на самом деле огромная, потому что первый вопрос предполагает разбор задачи, а второй уже подразумевает, что бежать в любом случае надо, осталось только направление выбрать. Так вот, если коротко - не надо бежать. Сам я не специалист по нейросетям. Много лет вожусь с базами данных в банках, в ритейле, в системной интеграции, и работа моя: смотреть, как данные живут в настоящих, не презентационных компаниях, и решать, что из задуманного взлетит, а что разобьётся об реальность. Через этот фильтр я и предлагаю взглянуть на нынешний шум вокруг локальных LLM, RAG и «корпоративных помощников».

https://habr.com/ru/articles/1037808/

#llm #rag #искусственный_интеллект #локальные_модели #эмбеддинги #архитектура_данных #хранилища_данных #внедрение_ии #data_engineering #цена_ошибки

#цена_ошибки #data_engineering #внедрение_ии #хранилища_данных #архитектура_данных #эмбеддинги

Habr @[email protected] · 2026-05-21 · 13:42 UTC

Вам продают ИИ. Покупать нужно не его

Звонил мне на днях один знакомый CIO. Питерский, ритейл, средний бизнес, ничего особенного. Слушай, говорит, надо нам с ИИ что-то делать: все вокруг внедряют, конкуренты вон что-то запустили, на отраслевом Data Summit уши прожужжали, а у меня даже плана нет. И денег, кстати, особо на это не выделили, но не суть. Это был, кажется, пятый такой звонок за месяц. И знаете, что меня в них всех поражает? Спрашивают они одно и то же, и спрашивают неправильно. Не «нужен ли нам ИИ», а «куда бежать, чтобы не опоздать», - разница на самом деле огромная, потому что первый вопрос предполагает разбор задачи, а второй уже подразумевает, что бежать в любом случае надо, осталось только направление выбрать. Так вот, если коротко - не надо бежать. Сам я не специалист по нейросетям. Много лет вожусь с базами данных в банках, в ритейле, в системной интеграции, и работа моя: смотреть, как данные живут в настоящих, не презентационных компаниях, и решать, что из задуманного взлетит, а что разобьётся об реальность. Через этот фильтр я и предлагаю взглянуть на нынешний шум вокруг локальных LLM, RAG и «корпоративных помощников».

https://habr.com/ru/articles/1037808/

#llm #rag #искусственный_интеллект #локальные_модели #эмбеддинги #архитектура_данных #хранилища_данных #внедрение_ии #data_engineering #цена_ошибки

#цена_ошибки #data_engineering #внедрение_ии #хранилища_данных #архитектура_данных #эмбеддинги

Habr @[email protected] · 2026-05-21 · 13:42 UTC

Вам продают ИИ. Покупать нужно не его

Звонил мне на днях один знакомый CIO. Питерский, ритейл, средний бизнес, ничего особенного. Слушай, говорит, надо нам с ИИ что-то делать: все вокруг внедряют, конкуренты вон что-то запустили, на отраслевом Data Summit уши прожужжали, а у меня даже плана нет. И денег, кстати, особо на это не выделили, но не суть. Это был, кажется, пятый такой звонок за месяц. И знаете, что меня в них всех поражает? Спрашивают они одно и то же, и спрашивают неправильно. Не «нужен ли нам ИИ», а «куда бежать, чтобы не опоздать», - разница на самом деле огромная, потому что первый вопрос предполагает разбор задачи, а второй уже подразумевает, что бежать в любом случае надо, осталось только направление выбрать. Так вот, если коротко - не надо бежать. Сам я не специалист по нейросетям. Много лет вожусь с базами данных в банках, в ритейле, в системной интеграции, и работа моя: смотреть, как данные живут в настоящих, не презентационных компаниях, и решать, что из задуманного взлетит, а что разобьётся об реальность. Через этот фильтр я и предлагаю взглянуть на нынешний шум вокруг локальных LLM, RAG и «корпоративных помощников».

https://habr.com/ru/articles/1037808/

#llm #rag #искусственный_интеллект #локальные_модели #эмбеддинги #архитектура_данных #хранилища_данных #внедрение_ии #data_engineering #цена_ошибки

#цена_ошибки #data_engineering #внедрение_ии #хранилища_данных #архитектура_данных #эмбеддинги

Habr @[email protected] · 2026-05-21 · 13:42 UTC

Вам продают ИИ. Покупать нужно не его

Звонил мне на днях один знакомый CIO. Питерский, ритейл, средний бизнес, ничего особенного. Слушай, говорит, надо нам с ИИ что-то делать: все вокруг внедряют, конкуренты вон что-то запустили, на отраслевом Data Summit уши прожужжали, а у меня даже плана нет. И денег, кстати, особо на это не выделили, но не суть. Это был, кажется, пятый такой звонок за месяц. И знаете, что меня в них всех поражает? Спрашивают они одно и то же, и спрашивают неправильно. Не «нужен ли нам ИИ», а «куда бежать, чтобы не опоздать», - разница на самом деле огромная, потому что первый вопрос предполагает разбор задачи, а второй уже подразумевает, что бежать в любом случае надо, осталось только направление выбрать. Так вот, если коротко - не надо бежать. Сам я не специалист по нейросетям. Много лет вожусь с базами данных в банках, в ритейле, в системной интеграции, и работа моя: смотреть, как данные живут в настоящих, не презентационных компаниях, и решать, что из задуманного взлетит, а что разобьётся об реальность. Через этот фильтр я и предлагаю взглянуть на нынешний шум вокруг локальных LLM, RAG и «корпоративных помощников».

https://habr.com/ru/articles/1037808/

#llm #rag #искусственный_интеллект #локальные_модели #эмбеддинги #архитектура_данных #хранилища_данных #внедрение_ии #data_engineering #цена_ошибки

#llm #rag #искусственный_интеллект #локальные_модели #эмбеддинги #архитектура_данных

Habr @[email protected] · 2026-05-19 · 03:22 UTC

Некорпоративный Хабр: семантический поиск и фильтрация по структурированным полям

Классический RAG индексирует исходный текст документа, предварительно разбивая на фрагменты. Потом рассчитывает векторное представление фрагментов и сохраняет их векторные представления в базу данных для поиска. Это дает возможность искать по сходству фрагментов текста и поискового запроса пользователя, но не дает возможность искать по более высокоуровневым резюме и смыслам, темам поднятым в тексте и прочему. Также не помогает с аналитикой по содержимому. Бесплатный проект text-metadata-generator позволяет выполнять запросы к LLM по каждому документу из коллекции документов, результаты вывода LLM проверяются по JSON схеме. Зачем может пригодиться эта программа и подход со структурированием текстовой информации своя библиотека с каталогом - поиск по локальным документам с использованием комбинации SQL предикатов и семантического поиска аналитика по документам, возможность находить новое в текстах: комбинируя структурированные поля созданные LLM из исходного текста, и находя закономерности с уже существующими в документе метаданными. Например, связывая с рейтингом признак NSFW, тон повествования, полноту содержания итп. разгрести “авгиевы конюшни” личных заметок в Obsidian или git репозитарии с Markdown файлами Рассмотрим как работает данный подход на 13275 статьях с Хабра, а также текстах трех песнен…

https://habr.com/ru/articles/1036594/

#семантический_поиск #структурирование_инфомации #локальный_поиск_по_документам #эмбеддинги #duckdb_wasm #wllama #llmприложения #sql #rag #llm

#llm #rag #sql #llmприложения #wllama #duckdb_wasm

Habr @[email protected] · 2026-05-19 · 03:22 UTC

Некорпоративный Хабр: семантический поиск и фильтрация по структурированным полям

Классический RAG индексирует исходный текст документа, предварительно разбивая на фрагменты. Потом рассчитывает векторное представление фрагментов и сохраняет их векторные представления в базу данных для поиска. Это дает возможность искать по сходству фрагментов текста и поискового запроса пользователя, но не дает возможность искать по более высокоуровневым резюме и смыслам, темам поднятым в тексте и прочему. Также не помогает с аналитикой по содержимому. Бесплатный проект text-metadata-generator позволяет выполнять запросы к LLM по каждому документу из коллекции документов, результаты вывода LLM проверяются по JSON схеме. Зачем может пригодиться эта программа и подход со структурированием текстовой информации своя библиотека с каталогом - поиск по локальным документам с использованием комбинации SQL предикатов и семантического поиска аналитика по документам, возможность находить новое в текстах: комбинируя структурированные поля созданные LLM из исходного текста, и находя закономерности с уже существующими в документе метаданными. Например, связывая с рейтингом признак NSFW, тон повествования, полноту содержания итп. разгрести “авгиевы конюшни” личных заметок в Obsidian или git репозитарии с Markdown файлами Рассмотрим как работает данный подход на 13275 статьях с Хабра, а также текстах трех песнен…

https://habr.com/ru/articles/1036594/

#семантический_поиск #структурирование_инфомации #локальный_поиск_по_документам #эмбеддинги #duckdb_wasm #wllama #llmприложения #sql #rag #llm

#llm #rag #sql #llmприложения #wllama #duckdb_wasm

Habr @[email protected] · 2026-05-19 · 03:22 UTC

Некорпоративный Хабр: семантический поиск и фильтрация по структурированным полям

Классический RAG индексирует исходный текст документа, предварительно разбивая на фрагменты. Потом рассчитывает векторное представление фрагментов и сохраняет их векторные представления в базу данных для поиска. Это дает возможность искать по сходству фрагментов текста и поискового запроса пользователя, но не дает возможность искать по более высокоуровневым резюме и смыслам, темам поднятым в тексте и прочему. Также не помогает с аналитикой по содержимому. Бесплатный проект text-metadata-generator позволяет выполнять запросы к LLM по каждому документу из коллекции документов, результаты вывода LLM проверяются по JSON схеме. Зачем может пригодиться эта программа и подход со структурированием текстовой информации своя библиотека с каталогом - поиск по локальным документам с использованием комбинации SQL предикатов и семантического поиска аналитика по документам, возможность находить новое в текстах: комбинируя структурированные поля созданные LLM из исходного текста, и находя закономерности с уже существующими в документе метаданными. Например, связывая с рейтингом признак NSFW, тон повествования, полноту содержания итп. разгрести “авгиевы конюшни” личных заметок в Obsidian или git репозитарии с Markdown файлами Рассмотрим как работает данный подход на 13275 статьях с Хабра, а также текстах трех песнен…

https://habr.com/ru/articles/1036594/

#семантический_поиск #структурирование_инфомации #локальный_поиск_по_документам #эмбеддинги #duckdb_wasm #wllama #llmприложения #sql #rag #llm

#llm #rag #sql #llmприложения #wllama #duckdb_wasm

Habr @[email protected] · 2026-05-19 · 03:22 UTC

Некорпоративный Хабр: семантический поиск и фильтрация по структурированным полям

Классический RAG индексирует исходный текст документа, предварительно разбивая на фрагменты. Потом рассчитывает векторное представление фрагментов и сохраняет их векторные представления в базу данных для поиска. Это дает возможность искать по сходству фрагментов текста и поискового запроса пользователя, но не дает возможность искать по более высокоуровневым резюме и смыслам, темам поднятым в тексте и прочему. Также не помогает с аналитикой по содержимому. Бесплатный проект text-metadata-generator позволяет выполнять запросы к LLM по каждому документу из коллекции документов, результаты вывода LLM проверяются по JSON схеме. Зачем может пригодиться эта программа и подход со структурированием текстовой информации своя библиотека с каталогом - поиск по локальным документам с использованием комбинации SQL предикатов и семантического поиска аналитика по документам, возможность находить новое в текстах: комбинируя структурированные поля созданные LLM из исходного текста, и находя закономерности с уже существующими в документе метаданными. Например, связывая с рейтингом признак NSFW, тон повествования, полноту содержания итп. разгрести “авгиевы конюшни” личных заметок в Obsidian или git репозитарии с Markdown файлами Рассмотрим как работает данный подход на 13275 статьях с Хабра, а также текстах трех песнен…

https://habr.com/ru/articles/1036594/

#семантический_поиск #структурирование_инфомации #локальный_поиск_по_документам #эмбеддинги #duckdb_wasm #wllama #llmприложения #sql #rag #llm

#семантический_поиск #структурирование_инфомации #локальный_поиск_по_документам #эмбеддинги #duckdb_wasm #wllama

Habr @[email protected] · 2026-05-11 · 12:22 UTC

Как я превратила Obsidian в структурированную память для ИИ‑агентов

Эта статья про NOUZ — локальный MCP‑сервер между Obsidian и ИИ‑агентом. Он превращает базу заметок в структурированную память: с уровнями, связями и сигналами дрейфа. Внутри — как я пришла к этой архитектуре и что она даёт агенту при работе с базой.

https://habr.com/ru/articles/1033746/

#Obsidian #RAG #ИИагенты #MCP #базы_знаний #DAG #эмбеддинги

#obsidian #rag #ииагенты #mcp #базы_знаний #dag

Habr @[email protected] · 2026-05-11 · 12:22 UTC

Как я превратила Obsidian в структурированную память для ИИ‑агентов

Эта статья про NOUZ — локальный MCP‑сервер между Obsidian и ИИ‑агентом. Он превращает базу заметок в структурированную память: с уровнями, связями и сигналами дрейфа. Внутри — как я пришла к этой архитектуре и что она даёт агенту при работе с базой.

https://habr.com/ru/articles/1033746/

#Obsidian #RAG #ИИагенты #MCP #базы_знаний #DAG #эмбеддинги

#эмбеддинги #dag #базы_знаний #mcp #ииагенты #rag

Habr @[email protected] · 2026-05-10 · 14:22 UTC

«Эмбеддинги на примерах с собаками», или как работать с векторными представлениями: книги и руководства по теме

Мы в

https://habr.com/ru/companies/beeline_cloud/articles/1033544/

#beeline_cloud #эмбеддинги #векторные_представления #семантический_анализ #семантический_поиск

#семантический_поиск #семантический_анализ #векторные_представления #эмбеддинги #beeline_cloud

Habr @[email protected] · 2026-05-10 · 14:22 UTC

«Эмбеддинги на примерах с собаками», или как работать с векторными представлениями: книги и руководства по теме

Мы в

https://habr.com/ru/companies/beeline_cloud/articles/1033544/

#beeline_cloud #эмбеддинги #векторные_представления #семантический_анализ #семантический_поиск

#семантический_поиск #семантический_анализ #векторные_представления #эмбеддинги #beeline_cloud

Habr @[email protected] · 2026-05-10 · 14:22 UTC

«Эмбеддинги на примерах с собаками», или как работать с векторными представлениями: книги и руководства по теме

Мы в

https://habr.com/ru/companies/beeline_cloud/articles/1033544/

#beeline_cloud #эмбеддинги #векторные_представления #семантический_анализ #семантический_поиск

#семантический_поиск #семантический_анализ #векторные_представления #эмбеддинги #beeline_cloud

Habr @[email protected] · 2026-05-10 · 14:22 UTC

«Эмбеддинги на примерах с собаками», или как работать с векторными представлениями: книги и руководства по теме

Мы в

https://habr.com/ru/companies/beeline_cloud/articles/1033544/

#beeline_cloud #эмбеддинги #векторные_представления #семантический_анализ #семантический_поиск

Habr @[email protected] · 2026-05-02 · 18:52 UTC

Бенчмарк 7 эмбеддингов и 4 реранкеров на корпусе судебной практики

Привет, Хабр. Это мой первый пост здесь, поэтому пара слов о себе. Я практикующий юрист, 8+ лет практики, последние годы - в производственном секторе. Веду договорную работу (поставка, подряд, услуги), сопровождаю сделки, закрываю претензионку и представляю компанию в арбитражных судах и спорах по защите прав потребителей - на стороне производителя и поставщика. К коду пришёл через вайбкодинг: захотелось автоматизировать некоторые процессы, начал ковыряться в VS Code, Trae, Cursor и Claude Code, втянулся - и теперь это параллельное хобби рядом с основной практикой. Последние несколько месяцев пилю IP Agent - телеграм-бота, который по запросу находит релевантную судебную практику и даёт прогноз по размеру компенсации в делах об интеллектуальной собственности. Работает на RAG-пайплайне. Когда строишь поиск по узкому домену, рано или поздно встаёт вопрос: какой эмбеддинг брать и нужен ли вообще реранкер. Готовых ответов под русскую судебную практику я не нашёл, поэтому собрал свой бенчмарк. В посте - что меряли, как меряли, что получилось и что в итоге поставил в бота.

https://habr.com/ru/articles/1030706/

#RAG #embeddings #эмбеддинги #реранкер #reranker #nDCG #информационный_поиск #юридический_ИИ #USER2base #бенчмарк

#бенчмарк #user2base #юридический_ии #информационный_поиск #ndcg #reranker

Habr @[email protected] · 2026-05-02 · 18:52 UTC

Бенчмарк 7 эмбеддингов и 4 реранкеров на корпусе судебной практики

Привет, Хабр. Это мой первый пост здесь, поэтому пара слов о себе. Я практикующий юрист, 8+ лет практики, последние годы - в производственном секторе. Веду договорную работу (поставка, подряд, услуги), сопровождаю сделки, закрываю претензионку и представляю компанию в арбитражных судах и спорах по защите прав потребителей - на стороне производителя и поставщика. К коду пришёл через вайбкодинг: захотелось автоматизировать некоторые процессы, начал ковыряться в VS Code, Trae, Cursor и Claude Code, втянулся - и теперь это параллельное хобби рядом с основной практикой. Последние несколько месяцев пилю IP Agent - телеграм-бота, который по запросу находит релевантную судебную практику и даёт прогноз по размеру компенсации в делах об интеллектуальной собственности. Работает на RAG-пайплайне. Когда строишь поиск по узкому домену, рано или поздно встаёт вопрос: какой эмбеддинг брать и нужен ли вообще реранкер. Готовых ответов под русскую судебную практику я не нашёл, поэтому собрал свой бенчмарк. В посте - что меряли, как меряли, что получилось и что в итоге поставил в бота.

https://habr.com/ru/articles/1030706/

#RAG #embeddings #эмбеддинги #реранкер #reranker #nDCG #информационный_поиск #юридический_ИИ #USER2base #бенчмарк

#бенчмарк #user2base #юридический_ии #информационный_поиск #ndcg #reranker

Habr @[email protected] · 2026-05-02 · 18:52 UTC

Бенчмарк 7 эмбеддингов и 4 реранкеров на корпусе судебной практики

Привет, Хабр. Это мой первый пост здесь, поэтому пара слов о себе. Я практикующий юрист, 8+ лет практики, последние годы - в производственном секторе. Веду договорную работу (поставка, подряд, услуги), сопровождаю сделки, закрываю претензионку и представляю компанию в арбитражных судах и спорах по защите прав потребителей - на стороне производителя и поставщика. К коду пришёл через вайбкодинг: захотелось автоматизировать некоторые процессы, начал ковыряться в VS Code, Trae, Cursor и Claude Code, втянулся - и теперь это параллельное хобби рядом с основной практикой. Последние несколько месяцев пилю IP Agent - телеграм-бота, который по запросу находит релевантную судебную практику и даёт прогноз по размеру компенсации в делах об интеллектуальной собственности. Работает на RAG-пайплайне. Когда строишь поиск по узкому домену, рано или поздно встаёт вопрос: какой эмбеддинг брать и нужен ли вообще реранкер. Готовых ответов под русскую судебную практику я не нашёл, поэтому собрал свой бенчмарк. В посте - что меряли, как меряли, что получилось и что в итоге поставил в бота.

https://habr.com/ru/articles/1030706/

#RAG #embeddings #эмбеддинги #реранкер #reranker #nDCG #информационный_поиск #юридический_ИИ #USER2base #бенчмарк

#бенчмарк #user2base #юридический_ии #информационный_поиск #ndcg #reranker

Habr @[email protected] · 2026-05-02 · 18:52 UTC

Бенчмарк 7 эмбеддингов и 4 реранкеров на корпусе судебной практики

Привет, Хабр. Это мой первый пост здесь, поэтому пара слов о себе. Я практикующий юрист, 8+ лет практики, последние годы - в производственном секторе. Веду договорную работу (поставка, подряд, услуги), сопровождаю сделки, закрываю претензионку и представляю компанию в арбитражных судах и спорах по защите прав потребителей - на стороне производителя и поставщика. К коду пришёл через вайбкодинг: захотелось автоматизировать некоторые процессы, начал ковыряться в VS Code, Trae, Cursor и Claude Code, втянулся - и теперь это параллельное хобби рядом с основной практикой. Последние несколько месяцев пилю IP Agent - телеграм-бота, который по запросу находит релевантную судебную практику и даёт прогноз по размеру компенсации в делах об интеллектуальной собственности. Работает на RAG-пайплайне. Когда строишь поиск по узкому домену, рано или поздно встаёт вопрос: какой эмбеддинг брать и нужен ли вообще реранкер. Готовых ответов под русскую судебную практику я не нашёл, поэтому собрал свой бенчмарк. В посте - что меряли, как меряли, что получилось и что в итоге поставил в бота.

https://habr.com/ru/articles/1030706/

#RAG #embeddings #эмбеддинги #реранкер #reranker #nDCG #информационный_поиск #юридический_ИИ #USER2base #бенчмарк

#rag #embeddings #эмбеддинги #реранкер #reranker #ndcg

Habr @[email protected] · 2026-04-29 · 18:42 UTC

[Перевод] Пять документов ломают ваш RAG: где реальная уязвимость и что с ней делать

RAG часто воспринимают как аккуратный способ «заземлить» LLM на документах и снизить риск галлюцинаций. Но у этой архитектуры есть менее очевидная проблема: контекст из базы знаний обычно считается доверенным, хотя именно через него в модель могут попасть вредоносные инструкции. В статье разбираем, как несколько отравленных документов могут повлиять на ответы системы, почему эмбеддинги нельзя считать безопасной абстракцией и какие уровни защиты нужны, если RAG используется не в демо, а в реальном продакшене. К рискам RAG

https://habr.com/ru/companies/otus/articles/1029742/

#RAG #LLM #промптинъекции #безопасность_llm #отравление_данных #векторные_базы_данных #эмбеддинги #OWASP_LLM_Top_10

#owasp_llm_top_10 #эмбеддинги #векторные_базы_данных #отравление_данных #безопасность_llm #промптинъекции

Habr @[email protected] · 2026-04-29 · 18:42 UTC

[Перевод] Пять документов ломают ваш RAG: где реальная уязвимость и что с ней делать

RAG часто воспринимают как аккуратный способ «заземлить» LLM на документах и снизить риск галлюцинаций. Но у этой архитектуры есть менее очевидная проблема: контекст из базы знаний обычно считается доверенным, хотя именно через него в модель могут попасть вредоносные инструкции. В статье разбираем, как несколько отравленных документов могут повлиять на ответы системы, почему эмбеддинги нельзя считать безопасной абстракцией и какие уровни защиты нужны, если RAG используется не в демо, а в реальном продакшене. К рискам RAG

https://habr.com/ru/companies/otus/articles/1029742/

#RAG #LLM #промптинъекции #безопасность_llm #отравление_данных #векторные_базы_данных #эмбеддинги #OWASP_LLM_Top_10

#owasp_llm_top_10 #эмбеддинги #векторные_базы_данных #отравление_данных #безопасность_llm #промптинъекции

Habr @[email protected] · 2026-04-29 · 18:42 UTC

[Перевод] Пять документов ломают ваш RAG: где реальная уязвимость и что с ней делать

RAG часто воспринимают как аккуратный способ «заземлить» LLM на документах и снизить риск галлюцинаций. Но у этой архитектуры есть менее очевидная проблема: контекст из базы знаний обычно считается доверенным, хотя именно через него в модель могут попасть вредоносные инструкции. В статье разбираем, как несколько отравленных документов могут повлиять на ответы системы, почему эмбеддинги нельзя считать безопасной абстракцией и какие уровни защиты нужны, если RAG используется не в демо, а в реальном продакшене. К рискам RAG

https://habr.com/ru/companies/otus/articles/1029742/

#RAG #LLM #промптинъекции #безопасность_llm #отравление_данных #векторные_базы_данных #эмбеддинги #OWASP_LLM_Top_10

#owasp_llm_top_10 #эмбеддинги #векторные_базы_данных #отравление_данных #безопасность_llm #промптинъекции

Habr @[email protected] · 2026-04-29 · 18:42 UTC

[Перевод] Пять документов ломают ваш RAG: где реальная уязвимость и что с ней делать

RAG часто воспринимают как аккуратный способ «заземлить» LLM на документах и снизить риск галлюцинаций. Но у этой архитектуры есть менее очевидная проблема: контекст из базы знаний обычно считается доверенным, хотя именно через него в модель могут попасть вредоносные инструкции. В статье разбираем, как несколько отравленных документов могут повлиять на ответы системы, почему эмбеддинги нельзя считать безопасной абстракцией и какие уровни защиты нужны, если RAG используется не в демо, а в реальном продакшене. К рискам RAG

https://habr.com/ru/companies/otus/articles/1029742/

#RAG #LLM #промптинъекции #безопасность_llm #отравление_данных #векторные_базы_данных #эмбеддинги #OWASP_LLM_Top_10

#rag #llm #промптинъекции #безопасность_llm #отравление_данных #векторные_базы_данных

Habr @[email protected] · 2026-04-08 · 03:02 UTC

Предварительная фильтрация KNN в Manticore Search

Векторный поиск редко используется сам по себе. Почти всегда есть фильтры — диапазон цен, категория, временное окно, географическая граница. Вопрос в том, когда именно эти фильтры применяются. Ответ оказывает неожиданно большое влияние на качество результатов. Предварительная фильтрация KNN доступна в Manticore Search начиная с версии 19.0.1 .

https://habr.com/ru/articles/1020166/

#knnsearch #алгоритмы_и_структуры_данных #полнотекстовый_поиск #векторный_поиск #оптимизация_поиска #фильтрация_данных #эмбеддинги

#эмбеддинги #фильтрация_данных #оптимизация_поиска #векторный_поиск #полнотекстовый_поиск #алгоритмы_и_структуры_данных

Habr @[email protected] · 2026-04-08 · 03:02 UTC

Предварительная фильтрация KNN в Manticore Search

Векторный поиск редко используется сам по себе. Почти всегда есть фильтры — диапазон цен, категория, временное окно, географическая граница. Вопрос в том, когда именно эти фильтры применяются. Ответ оказывает неожиданно большое влияние на качество результатов. Предварительная фильтрация KNN доступна в Manticore Search начиная с версии 19.0.1 .

https://habr.com/ru/articles/1020166/

#knnsearch #алгоритмы_и_структуры_данных #полнотекстовый_поиск #векторный_поиск #оптимизация_поиска #фильтрация_данных #эмбеддинги

#эмбеддинги #фильтрация_данных #оптимизация_поиска #векторный_поиск #полнотекстовый_поиск #алгоритмы_и_структуры_данных

Habr @[email protected] · 2026-04-08 · 03:02 UTC

Предварительная фильтрация KNN в Manticore Search

Векторный поиск редко используется сам по себе. Почти всегда есть фильтры — диапазон цен, категория, временное окно, географическая граница. Вопрос в том, когда именно эти фильтры применяются. Ответ оказывает неожиданно большое влияние на качество результатов. Предварительная фильтрация KNN доступна в Manticore Search начиная с версии 19.0.1 .

https://habr.com/ru/articles/1020166/

#knnsearch #алгоритмы_и_структуры_данных #полнотекстовый_поиск #векторный_поиск #оптимизация_поиска #фильтрация_данных #эмбеддинги

#эмбеддинги #фильтрация_данных #оптимизация_поиска #векторный_поиск #полнотекстовый_поиск #алгоритмы_и_структуры_данных

Habr @[email protected] · 2026-04-08 · 03:02 UTC

Предварительная фильтрация KNN в Manticore Search

Векторный поиск редко используется сам по себе. Почти всегда есть фильтры — диапазон цен, категория, временное окно, географическая граница. Вопрос в том, когда именно эти фильтры применяются. Ответ оказывает неожиданно большое влияние на качество результатов. Предварительная фильтрация KNN доступна в Manticore Search начиная с версии 19.0.1 .

https://habr.com/ru/articles/1020166/

#knnsearch #алгоритмы_и_структуры_данных #полнотекстовый_поиск #векторный_поиск #оптимизация_поиска #фильтрация_данных #эмбеддинги

#knnsearch #алгоритмы_и_структуры_данных #полнотекстовый_поиск #векторный_поиск #оптимизация_поиска #фильтрация_данных

Habr @[email protected] · 2026-03-27 · 14:42 UTC

TAPe‑дневник, день 7: первый уход от трансформеров и “почти бесплатная” сегментация

В этом посте продолжаем дневник TAPe‑детекции и рассказываем, что получилось после отказа от трансформеров: насколько сократилось число параметров, как работают локальные ассоциации TAPe‑патчей и почему на лице человека у нас начинает “сам по себе” появляться зачаток сегментации. В итоге мы можем в некотором роде классифицировать понятие “кожа”. Да, напрямую мы этого не делаем, но из обучения так выходит, потому что одежда – это натуральная граница внутри самого объекта “человек”, и эти сегменты мы находим, потому что полагаемся на самые контрастные патчи, чтобы собрать из них общее описание всего объекта... Читать про кожу

https://habr.com/ru/articles/1016036/

#машинное_обучение #синтетические_данные #tape+ml #attention #трансформеры #эмбеддинги #selfsupervised #COCO #сегментация #детекция_объектов

#детекция_объектов #сегментация #coco #selfsupervised #эмбеддинги #трансформеры

Habr @[email protected] · 2026-03-27 · 14:42 UTC

TAPe‑дневник, день 7: первый уход от трансформеров и “почти бесплатная” сегментация

В этом посте продолжаем дневник TAPe‑детекции и рассказываем, что получилось после отказа от трансформеров: насколько сократилось число параметров, как работают локальные ассоциации TAPe‑патчей и почему на лице человека у нас начинает “сам по себе” появляться зачаток сегментации. В итоге мы можем в некотором роде классифицировать понятие “кожа”. Да, напрямую мы этого не делаем, но из обучения так выходит, потому что одежда – это натуральная граница внутри самого объекта “человек”, и эти сегменты мы находим, потому что полагаемся на самые контрастные патчи, чтобы собрать из них общее описание всего объекта... Читать про кожу

https://habr.com/ru/articles/1016036/

#машинное_обучение #синтетические_данные #tape+ml #attention #трансформеры #эмбеддинги #selfsupervised #COCO #сегментация #детекция_объектов

#детекция_объектов #сегментация #coco #selfsupervised #эмбеддинги #трансформеры

Habr @[email protected] · 2026-03-27 · 14:42 UTC

TAPe‑дневник, день 7: первый уход от трансформеров и “почти бесплатная” сегментация

В этом посте продолжаем дневник TAPe‑детекции и рассказываем, что получилось после отказа от трансформеров: насколько сократилось число параметров, как работают локальные ассоциации TAPe‑патчей и почему на лице человека у нас начинает “сам по себе” появляться зачаток сегментации. В итоге мы можем в некотором роде классифицировать понятие “кожа”. Да, напрямую мы этого не делаем, но из обучения так выходит, потому что одежда – это натуральная граница внутри самого объекта “человек”, и эти сегменты мы находим, потому что полагаемся на самые контрастные патчи, чтобы собрать из них общее описание всего объекта... Читать про кожу

https://habr.com/ru/articles/1016036/

#машинное_обучение #синтетические_данные #tape+ml #attention #трансформеры #эмбеддинги #selfsupervised #COCO #сегментация #детекция_объектов

#машинное_обучение #синтетические_данные #tape #attention #трансформеры #эмбеддинги

Habr @[email protected] · 2026-03-27 · 14:42 UTC

TAPe‑дневник, день 7: первый уход от трансформеров и “почти бесплатная” сегментация

В этом посте продолжаем дневник TAPe‑детекции и рассказываем, что получилось после отказа от трансформеров: насколько сократилось число параметров, как работают локальные ассоциации TAPe‑патчей и почему на лице человека у нас начинает “сам по себе” появляться зачаток сегментации. В итоге мы можем в некотором роде классифицировать понятие “кожа”. Да, напрямую мы этого не делаем, но из обучения так выходит, потому что одежда – это натуральная граница внутри самого объекта “человек”, и эти сегменты мы находим, потому что полагаемся на самые контрастные патчи, чтобы собрать из них общее описание всего объекта... Читать про кожу

https://habr.com/ru/articles/1016036/

#машинное_обучение #синтетические_данные #tape+ml #attention #трансформеры #эмбеддинги #selfsupervised #COCO #сегментация #детекция_объектов

#детекция_объектов #сегментация #coco #selfsupervised #эмбеддинги #трансформеры

Habr @[email protected] · 2026-03-26 · 15:22 UTC

TAPe‑дневник, день 6: синтетика, эмбеддинги и первый уход от трансформеров

В этой статье продолжаем онлайн‑дневник экспериментов с TAPe‑подходом к компьютерному зрению на COCO. Здесь – про обучение эмбеддингов на полностью синтетических TAPe‑данных, 74% точности классификации на 5k val‑изображениях и первые выводы о том, почему стандартные трансформеры нам не подходят. Долой трансформеры

https://habr.com/ru/articles/1015514/

#машинное_обучение #трансформеры #детекция #эмбеддинги #синтетические_данные #классификация_изображений #компьютерное_зрение #selfsupervised #attention #tape+ml

#tape #attention #selfsupervised #компьютерное_зрение #классификация_изображений #синтетические_данные

Habr @[email protected] · 2026-03-26 · 15:22 UTC

TAPe‑дневник, день 6: синтетика, эмбеддинги и первый уход от трансформеров

В этой статье продолжаем онлайн‑дневник экспериментов с TAPe‑подходом к компьютерному зрению на COCO. Здесь – про обучение эмбеддингов на полностью синтетических TAPe‑данных, 74% точности классификации на 5k val‑изображениях и первые выводы о том, почему стандартные трансформеры нам не подходят. Долой трансформеры

https://habr.com/ru/articles/1015514/

#машинное_обучение #трансформеры #детекция #эмбеддинги #синтетические_данные #классификация_изображений #компьютерное_зрение #selfsupervised #attention #tape+ml

#tape #attention #selfsupervised #компьютерное_зрение #классификация_изображений #синтетические_данные

Habr @[email protected] · 2026-03-26 · 15:22 UTC

TAPe‑дневник, день 6: синтетика, эмбеддинги и первый уход от трансформеров

В этой статье продолжаем онлайн‑дневник экспериментов с TAPe‑подходом к компьютерному зрению на COCO. Здесь – про обучение эмбеддингов на полностью синтетических TAPe‑данных, 74% точности классификации на 5k val‑изображениях и первые выводы о том, почему стандартные трансформеры нам не подходят. Долой трансформеры

https://habr.com/ru/articles/1015514/

#машинное_обучение #трансформеры #детекция #эмбеддинги #синтетические_данные #классификация_изображений #компьютерное_зрение #selfsupervised #attention #tape+ml

#машинное_обучение #трансформеры #детекция #эмбеддинги #синтетические_данные #классификация_изображений

Habr @[email protected] · 2026-03-26 · 15:22 UTC

TAPe‑дневник, день 6: синтетика, эмбеддинги и первый уход от трансформеров

В этой статье продолжаем онлайн‑дневник экспериментов с TAPe‑подходом к компьютерному зрению на COCO. Здесь – про обучение эмбеддингов на полностью синтетических TAPe‑данных, 74% точности классификации на 5k val‑изображениях и первые выводы о том, почему стандартные трансформеры нам не подходят. Долой трансформеры

https://habr.com/ru/articles/1015514/

#машинное_обучение #трансформеры #детекция #эмбеддинги #синтетические_данные #классификация_изображений #компьютерное_зрение #selfsupervised #attention #tape+ml

#tape #attention #selfsupervised #компьютерное_зрение #классификация_изображений #синтетические_данные

Habr @[email protected] · 2026-03-25 · 15:22 UTC

TAPe-дневник, день 5: 98% на 2% COCO, меньше “фона” и первые боксы

В этой статье продолжаем онлайн‑дневник экспериментов с TAPe‑подходом к компьютерному зрению на COCO. Кратко: подняли точность до ~98% на двухпроцентной выборке, уменьшили количество ложных срабатываний и начали переход от поиска центроидов к детекции прямоугольников вокруг объектов. Скорее узреть

https://habr.com/ru/articles/1014966/

#компьютерное_зрение #COCO #эмбеддинги #TAPe+ML #selfsupervised #attention #ложные_срабатывания #кластеризация #машинное_обучение #нейросети

#нейросети #машинное_обучение #кластеризация #ложные_срабатывания #attention #selfsupervised

Habr @[email protected] · 2026-03-22 · 17:12 UTC

От слов к числам: как машина узнаёт, о чём текст

Как заставить компьютер понимать текст? Мы взяли 500 новостей и с помощью алгоритма автоматически разложили их по категориям: спорт, политика, развлечения. Результат: 99% совпадения с ручной разметкой! В статье объясняю, как работают векторные представления слов и как работает кластеризация

https://habr.com/ru/articles/1013404/

#nlp #nlp_обработка_текста #научнопопулярное #научпоп #машинное+обучение #эмбеддинги #векторы #математика

#математика #векторы #эмбеддинги #машинное #научпоп #научнопопулярное

Habr @[email protected] · 2026-03-22 · 12:42 UTC

RAG: как Филин Палыч-реранкер навел порядок в цифровом королевстве

Если вы хоть раз общались с большими языковыми моделями, то знаете их главную слабость: они патологические лжецы. Они могут с абсолютной уверенностью рассказывать о вещах, которых никогда не существовало. В мире IT это называют «галлюцинациями», а лечат их с помощью RAG (Retrieval-Augmented Generation) . Если просто: это способ дать модели «шпаргалку» из ваших документов, чтобы она не гадала, а опиралась на факты. Но как эта сложная механика выглядит изнутри? Давайте разберем устройство RAG на примере одной поучительной истории из Цифрового Королевства, где один рыжий Кот чуть не довел Бизнес до нервного срыва своим враньем.

https://habr.com/ru/articles/1011992/

#RAG #LLM #Reranker #Векторный_поиск #научпоп #эмбеддинги

#эмбеддинги #научпоп #векторный_поиск #reranker #llm #rag

Habr @[email protected] · 2026-03-17 · 18:12 UTC

[Перевод] Как оценивать RAG-системы: метрики, методы и что измерять в первую очередь

Когда RAG-система дает сбой, по финальному ответу почти невозможно понять, где именно произошла ошибка. Генерация с дополнением через поиск – один из базовых паттернов работы с контекстом в LLM-приложениях: он расширяет знания модели за счет поиска, но одновременно усложняет диагностику. В результате без внятной системы оценки любые проблемы выглядят одинаково – как «неверный ответ». В этом материале разберем, что именно стоит измерять в RAG-конвейере, какие метрики действительно помогают находить причину сбоев и как выстроить оценку так, чтобы она показывала не факт ошибки, а ее источник. Разобраться

https://habr.com/ru/companies/otus/articles/1011464/

#RAG #retrievalaugmented_generation #оценка_LLM #метрики_качества #галлюцинации_моделей #информационный_поиск #эмбеддинги #ранжирование_документов #AIархитектура

#aiархитектура #ранжирование_документов #эмбеддинги #информационный_поиск #галлюцинации_моделей #метрики_качества

Habr @[email protected] · 2026-03-17 · 18:12 UTC

[Перевод] Как оценивать RAG-системы: метрики, методы и что измерять в первую очередь

Когда RAG-система дает сбой, по финальному ответу почти невозможно понять, где именно произошла ошибка. Генерация с дополнением через поиск – один из базовых паттернов работы с контекстом в LLM-приложениях: он расширяет знания модели за счет поиска, но одновременно усложняет диагностику. В результате без внятной системы оценки любые проблемы выглядят одинаково – как «неверный ответ». В этом материале разберем, что именно стоит измерять в RAG-конвейере, какие метрики действительно помогают находить причину сбоев и как выстроить оценку так, чтобы она показывала не факт ошибки, а ее источник. Разобраться

https://habr.com/ru/companies/otus/articles/1011464/

#RAG #retrievalaugmented_generation #оценка_LLM #метрики_качества #галлюцинации_моделей #информационный_поиск #эмбеддинги #ранжирование_документов #AIархитектура

#aiархитектура #ранжирование_документов #эмбеддинги #информационный_поиск #галлюцинации_моделей #метрики_качества

Habr @[email protected] · 2026-03-17 · 18:12 UTC

[Перевод] Как оценивать RAG-системы: метрики, методы и что измерять в первую очередь

Когда RAG-система дает сбой, по финальному ответу почти невозможно понять, где именно произошла ошибка. Генерация с дополнением через поиск – один из базовых паттернов работы с контекстом в LLM-приложениях: он расширяет знания модели за счет поиска, но одновременно усложняет диагностику. В результате без внятной системы оценки любые проблемы выглядят одинаково – как «неверный ответ». В этом материале разберем, что именно стоит измерять в RAG-конвейере, какие метрики действительно помогают находить причину сбоев и как выстроить оценку так, чтобы она показывала не факт ошибки, а ее источник. Разобраться

https://habr.com/ru/companies/otus/articles/1011464/

#RAG #retrievalaugmented_generation #оценка_LLM #метрики_качества #галлюцинации_моделей #информационный_поиск #эмбеддинги #ранжирование_документов #AIархитектура

#aiархитектура #ранжирование_документов #эмбеддинги #информационный_поиск #галлюцинации_моделей #метрики_качества