#qdrant — Public Fediverse posts on home.social

Habr @[email protected] · 2026-05-26 · 08:52 UTC

RAG без downtime: настраиваем инкрементальное обновление документов на Qdrant и LangChain

PM: Нам нужно актуализировать базу знаний для ИИ-ассистента, там изменилась инструкция по смене пароля. DevOps: Не проблема, сейчас запущу скрипт, через два часа всё обновится. Предупреди Заказчика о недоступности сервиса. Знакомая ситуация? Полная зачистка векторной базы и реиндексация всех имеющихся документов с остановкой сервиса - решение простое и надёжное, но «прощается» только на этапе прототипа. В продакшене могут быть сотни тысяч документов, живые пользователи и SLA с требованием по доступности сервиса. Обновилась одна, пусть и очень важная инструкция, и сервис недоступен два часа. А если таких обновлений десятки в неделю? Давайте исправим это и напишем ETL-скрипт , который умеет добавлять, обновлять и удалять отдельные документы без остановки сервиса.

https://habr.com/ru/articles/1038456/

#rag #etlпайплайн #qdrant #qdrant_vector_store #масштабирование #airflow #python #rag_система

#rag_система #python #airflow #масштабирование #qdrant_vector_store #qdrant

Habr @[email protected] · 2026-05-26 · 08:52 UTC

RAG без downtime: настраиваем инкрементальное обновление документов на Qdrant и LangChain

PM: Нам нужно актуализировать базу знаний для ИИ-ассистента, там изменилась инструкция по смене пароля. DevOps: Не проблема, сейчас запущу скрипт, через два часа всё обновится. Предупреди Заказчика о недоступности сервиса. Знакомая ситуация? Полная зачистка векторной базы и реиндексация всех имеющихся документов с остановкой сервиса - решение простое и надёжное, но «прощается» только на этапе прототипа. В продакшене могут быть сотни тысяч документов, живые пользователи и SLA с требованием по доступности сервиса. Обновилась одна, пусть и очень важная инструкция, и сервис недоступен два часа. А если таких обновлений десятки в неделю? Давайте исправим это и напишем ETL-скрипт , который умеет добавлять, обновлять и удалять отдельные документы без остановки сервиса.

https://habr.com/ru/articles/1038456/

#rag #etlпайплайн #qdrant #qdrant_vector_store #масштабирование #airflow #python #rag_система

#rag_система #python #airflow #масштабирование #qdrant_vector_store #qdrant

Habr @[email protected] · 2026-05-26 · 08:52 UTC

RAG без downtime: настраиваем инкрементальное обновление документов на Qdrant и LangChain

PM: Нам нужно актуализировать базу знаний для ИИ-ассистента, там изменилась инструкция по смене пароля. DevOps: Не проблема, сейчас запущу скрипт, через два часа всё обновится. Предупреди Заказчика о недоступности сервиса. Знакомая ситуация? Полная зачистка векторной базы и реиндексация всех имеющихся документов с остановкой сервиса - решение простое и надёжное, но «прощается» только на этапе прототипа. В продакшене могут быть сотни тысяч документов, живые пользователи и SLA с требованием по доступности сервиса. Обновилась одна, пусть и очень важная инструкция, и сервис недоступен два часа. А если таких обновлений десятки в неделю? Давайте исправим это и напишем ETL-скрипт , который умеет добавлять, обновлять и удалять отдельные документы без остановки сервиса.

https://habr.com/ru/articles/1038456/

#rag #etlпайплайн #qdrant #qdrant_vector_store #масштабирование #airflow #python #rag_система

#rag_система #python #airflow #масштабирование #qdrant_vector_store #qdrant

Habr @[email protected] · 2026-05-26 · 08:52 UTC

RAG без downtime: настраиваем инкрементальное обновление документов на Qdrant и LangChain

PM: Нам нужно актуализировать базу знаний для ИИ-ассистента, там изменилась инструкция по смене пароля. DevOps: Не проблема, сейчас запущу скрипт, через два часа всё обновится. Предупреди Заказчика о недоступности сервиса. Знакомая ситуация? Полная зачистка векторной базы и реиндексация всех имеющихся документов с остановкой сервиса - решение простое и надёжное, но «прощается» только на этапе прототипа. В продакшене могут быть сотни тысяч документов, живые пользователи и SLA с требованием по доступности сервиса. Обновилась одна, пусть и очень важная инструкция, и сервис недоступен два часа. А если таких обновлений десятки в неделю? Давайте исправим это и напишем ETL-скрипт , который умеет добавлять, обновлять и удалять отдельные документы без остановки сервиса.

https://habr.com/ru/articles/1038456/

#rag #etlпайплайн #qdrant #qdrant_vector_store #масштабирование #airflow #python #rag_система

#rag #etlпайплайн #qdrant #qdrant_vector_store #масштабирование #airflow

Habr @[email protected] · 2026-05-25 · 11:32 UTC

Хакатон Samsung IT Academy Hack 2026: как студенты оптимизировали поиск в корпоративном мессенджере

Поиск — штука настолько привычная, что её редко рассматривают как отдельную инженерную задачу. На деле это связка из четырёх частей: парсинг и нормализация исходных данных, индексация, обработка пользовательского запроса и ранжирование результатов. Каждая из них живёт по своим правилам и ломается по своим причинам. Сложно представить более прикладную область, поэтому на хакатоне IT Academy Hack 2026 от IT Академии Samsung Innovation Campus в этом году, мы решили попросить студентов предложить варианты улучшения поиска по сообщениям в контуре корпоративного мессенджера. Кстати, VK Tech стал индустриальным партнером конкурса уже во второй раз — предоставил инфраструктуру для студентов, и стал одним из постановщиков задач. Меня зовут Сергей Харламов, я руковожу Исследовательской лабораторией VK Tech . В этой статье расскажу об актуальных проблемах оптимизации поиска, а также о задаче и подходах, которые можно было применить для ее решения.

https://habr.com/ru/companies/vktech/articles/1038306/

#хакатон #поиск #информационный_поиск #elasticsearch #qdrant #embeddings #векторный_поиск #ранжирование #vk_workspace #vk_tech

#vk_tech #vk_workspace #ранжирование #векторный_поиск #embeddings #qdrant

Habr @[email protected] · 2026-05-22 · 12:32 UTC

Практический ИИ-агент Python: LangGraph + Qdrant

При разработке ИИ-агента для базы знаний, мне казалось, что задача почти типовая: складываем информацию в Qdrant, находим информацию через векторный поиск и поиск в интернете и формируем красивый ответ через LLM. На деле ИИ-агент начал уверенно галлюцинировать, приносить не только нерелевантные ответы, но и тупить с короткими пользовательскими запросами. И самое неприятное, при всем при этом метрика «похожести» similarity выглядела достаточно высокой, что сильно вводило в заблуждение. После серии экспериментов и улучшений пришло понимание, что промышленный ИИ-агент — это не столько про LLM, сколько про качество извлечения информации и гибкую оркестрацию компонентов ИИ-агента. Что в итоге полностью поменяло архитектуру моей системы. В статье расскажу, как я пришла от «просто добавь LLM» к промышленному графовому ИИ-агенту на LangGraph + Qdrant.

https://habr.com/ru/articles/1038190/

#aiагенты #retrieval #llmагент #qdrant #rag #langgraph

#langgraph #rag #qdrant #llmагент #retrieval #aiагенты

Habr @[email protected] · 2026-05-22 · 12:32 UTC

Практический ИИ-агент Python: LangGraph + Qdrant

При разработке ИИ-агента для базы знаний, мне казалось, что задача почти типовая: складываем информацию в Qdrant, находим информацию через векторный поиск и поиск в интернете и формируем красивый ответ через LLM. На деле ИИ-агент начал уверенно галлюцинировать, приносить не только нерелевантные ответы, но и тупить с короткими пользовательскими запросами. И самое неприятное, при всем при этом метрика «похожести» similarity выглядела достаточно высокой, что сильно вводило в заблуждение. После серии экспериментов и улучшений пришло понимание, что промышленный ИИ-агент — это не столько про LLM, сколько про качество извлечения информации и гибкую оркестрацию компонентов ИИ-агента. Что в итоге полностью поменяло архитектуру моей системы. В статье расскажу, как я пришла от «просто добавь LLM» к промышленному графовому ИИ-агенту на LangGraph + Qdrant.

https://habr.com/ru/articles/1038190/

#aiагенты #retrieval #llmагент #qdrant #rag #langgraph

#langgraph #rag #qdrant #llmагент #retrieval #aiагенты

Habr @[email protected] · 2026-05-22 · 12:32 UTC

Практический ИИ-агент Python: LangGraph + Qdrant

При разработке ИИ-агента для базы знаний, мне казалось, что задача почти типовая: складываем информацию в Qdrant, находим информацию через векторный поиск и поиск в интернете и формируем красивый ответ через LLM. На деле ИИ-агент начал уверенно галлюцинировать, приносить не только нерелевантные ответы, но и тупить с короткими пользовательскими запросами. И самое неприятное, при всем при этом метрика «похожести» similarity выглядела достаточно высокой, что сильно вводило в заблуждение. После серии экспериментов и улучшений пришло понимание, что промышленный ИИ-агент — это не столько про LLM, сколько про качество извлечения информации и гибкую оркестрацию компонентов ИИ-агента. Что в итоге полностью поменяло архитектуру моей системы. В статье расскажу, как я пришла от «просто добавь LLM» к промышленному графовому ИИ-агенту на LangGraph + Qdrant.

https://habr.com/ru/articles/1038190/

#aiагенты #retrieval #llmагент #qdrant #rag #langgraph

#langgraph #rag #qdrant #llmагент #retrieval #aiагенты

Habr @[email protected] · 2026-05-22 · 12:32 UTC

Практический ИИ-агент Python: LangGraph + Qdrant

При разработке ИИ-агента для базы знаний, мне казалось, что задача почти типовая: складываем информацию в Qdrant, находим информацию через векторный поиск и поиск в интернете и формируем красивый ответ через LLM. На деле ИИ-агент начал уверенно галлюцинировать, приносить не только нерелевантные ответы, но и тупить с короткими пользовательскими запросами. И самое неприятное, при всем при этом метрика «похожести» similarity выглядела достаточно высокой, что сильно вводило в заблуждение. После серии экспериментов и улучшений пришло понимание, что промышленный ИИ-агент — это не столько про LLM, сколько про качество извлечения информации и гибкую оркестрацию компонентов ИИ-агента. Что в итоге полностью поменяло архитектуру моей системы. В статье расскажу, как я пришла от «просто добавь LLM» к промышленному графовому ИИ-агенту на LangGraph + Qdrant.

https://habr.com/ru/articles/1038190/

#aiагенты #retrieval #llmагент #qdrant #rag #langgraph

Habr @[email protected] · 2026-05-13 · 11:12 UTC

Как мы довели поиск товаров по изображению до 98% совпадений: FastAPI, DINOv2, Qdrant и поиск на фото полки

Поиск товара по изображению кажется простой задачей — ровно до момента, пока не сталкиваешься с реальным каталогом . В теории все выглядит аккуратно: берем фото, считаем embedding, ищем ближайшие вектора, возвращаем совпадения. На практике начинаются нюансы: у товара несколько изображений, ракурсы отличаются, фон мешает, каталог обновляется постоянно, а бизнес ждет не исследовательский прототип, а сервис, который можно поставить в production. С вами старший программист в Fix Price Константин Репин. И в этом материале разберу, как мы строили сервис визуального поиска товаров, какие инженерные решения реально повлияли на качество и почему текущий результат в 98% совпадений получился не из-за одной удачной модели, а из-за правильно собранного пайплайна.

https://habr.com/ru/companies/fix_price/articles/1034664/

#поиск_товаров #FastAPI #dinov2 #qdrant #визуальные_эмбеддинги #векторный_поиск

#векторный_поиск #визуальные_эмбеддинги #qdrant #dinov2 #fastapi #поиск_товаров

Habr @[email protected] · 2026-05-13 · 11:12 UTC

Как мы довели поиск товаров по изображению до 98% совпадений: FastAPI, DINOv2, Qdrant и поиск на фото полки

Поиск товара по изображению кажется простой задачей — ровно до момента, пока не сталкиваешься с реальным каталогом . В теории все выглядит аккуратно: берем фото, считаем embedding, ищем ближайшие вектора, возвращаем совпадения. На практике начинаются нюансы: у товара несколько изображений, ракурсы отличаются, фон мешает, каталог обновляется постоянно, а бизнес ждет не исследовательский прототип, а сервис, который можно поставить в production. С вами старший программист в Fix Price Константин Репин. И в этом материале разберу, как мы строили сервис визуального поиска товаров, какие инженерные решения реально повлияли на качество и почему текущий результат в 98% совпадений получился не из-за одной удачной модели, а из-за правильно собранного пайплайна.

https://habr.com/ru/companies/fix_price/articles/1034664/

#поиск_товаров #FastAPI #dinov2 #qdrant #визуальные_эмбеддинги #векторный_поиск

#векторный_поиск #визуальные_эмбеддинги #qdrant #dinov2 #fastapi #поиск_товаров

Habr @[email protected] · 2026-05-13 · 11:12 UTC

Как мы довели поиск товаров по изображению до 98% совпадений: FastAPI, DINOv2, Qdrant и поиск на фото полки

Поиск товара по изображению кажется простой задачей — ровно до момента, пока не сталкиваешься с реальным каталогом . В теории все выглядит аккуратно: берем фото, считаем embedding, ищем ближайшие вектора, возвращаем совпадения. На практике начинаются нюансы: у товара несколько изображений, ракурсы отличаются, фон мешает, каталог обновляется постоянно, а бизнес ждет не исследовательский прототип, а сервис, который можно поставить в production. С вами старший программист в Fix Price Константин Репин. И в этом материале разберу, как мы строили сервис визуального поиска товаров, какие инженерные решения реально повлияли на качество и почему текущий результат в 98% совпадений получился не из-за одной удачной модели, а из-за правильно собранного пайплайна.

https://habr.com/ru/companies/fix_price/articles/1034664/

#поиск_товаров #FastAPI #dinov2 #qdrant #визуальные_эмбеддинги #векторный_поиск

#векторный_поиск #визуальные_эмбеддинги #qdrant #dinov2 #fastapi #поиск_товаров

Habr @[email protected] · 2026-05-13 · 11:12 UTC

Как мы довели поиск товаров по изображению до 98% совпадений: FastAPI, DINOv2, Qdrant и поиск на фото полки

Поиск товара по изображению кажется простой задачей — ровно до момента, пока не сталкиваешься с реальным каталогом . В теории все выглядит аккуратно: берем фото, считаем embedding, ищем ближайшие вектора, возвращаем совпадения. На практике начинаются нюансы: у товара несколько изображений, ракурсы отличаются, фон мешает, каталог обновляется постоянно, а бизнес ждет не исследовательский прототип, а сервис, который можно поставить в production. С вами старший программист в Fix Price Константин Репин. И в этом материале разберу, как мы строили сервис визуального поиска товаров, какие инженерные решения реально повлияли на качество и почему текущий результат в 98% совпадений получился не из-за одной удачной модели, а из-за правильно собранного пайплайна.

https://habr.com/ru/companies/fix_price/articles/1034664/

#поиск_товаров #FastAPI #dinov2 #qdrant #визуальные_эмбеддинги #векторный_поиск

#поиск_товаров #fastapi #dinov2 #qdrant #визуальные_эмбеддинги #векторный_поиск

GOMOOT :mastodon: @[email protected] · 2026-05-12 · 12:42 UTC

💡 Docling + Ollama + Qdrant: costruisci una knowledge base privata con Qwen3.6 in locale
https://gomoot.com/docling-la-libreria-open-source-per-il-pdf-parsing-nelle-pipeline-rag-con-ollama-e-qdrant/

#docling #ollama #parsing #pdf #qdrant #rag

GOMOOT :mastodon: @[email protected] · 2026-05-12 · 12:42 UTC

💡 Docling + Ollama + Qdrant: costruisci una knowledge base privata con Qwen3.6 in locale
https://gomoot.com/docling-la-libreria-open-source-per-il-pdf-parsing-nelle-pipeline-rag-con-ollama-e-qdrant/

#docling #ollama #parsing #pdf #qdrant #rag

GOMOOT :mastodon: @[email protected] · 2026-05-12 · 12:42 UTC

💡 Docling + Ollama + Qdrant: costruisci una knowledge base privata con Qwen3.6 in locale
https://gomoot.com/docling-la-libreria-open-source-per-il-pdf-parsing-nelle-pipeline-rag-con-ollama-e-qdrant/

#docling #ollama #parsing #pdf #qdrant #rag

#rag #qdrant #pdf #parsing #ollama #docling

GOMOOT :mastodon: @[email protected] · 2026-05-12 · 12:42 UTC

💡 Docling + Ollama + Qdrant: costruisci una knowledge base privata con Qwen3.6 in locale
https://gomoot.com/docling-la-libreria-open-source-per-il-pdf-parsing-nelle-pipeline-rag-con-ollama-e-qdrant/

#docling #ollama #parsing #pdf #qdrant #rag

Habr @[email protected] · 2026-05-05 · 20:12 UTC

SocratiCode: разбираю MCP-сервер, который даёт ИИ-агенту понимание кодовой базы

Если ваш ИИ-агент при каждом вопросе начинает grep-ом по всему проекту — у меня есть для вас одна штука. SocratiCode — это MCP-сервер, который индексирует кодовую базу через Qdrant и даёт агенту нормальный поиск вместо построчного чтения. Разобрал, как он устроен внутри, потестировал на нашем монорепе и сравнил с обычным режимом Claude Code

https://habr.com/ru/articles/1031878/

#MCP #Claude_Code #векторный_поиск #Qdrant #Ollama #codebase_intelligence #AIагенты #RAG

#rag #aiагенты #codebase_intelligence #ollama #qdrant #векторный_поиск

Habr @[email protected] · 2026-05-05 · 20:12 UTC

SocratiCode: разбираю MCP-сервер, который даёт ИИ-агенту понимание кодовой базы

Если ваш ИИ-агент при каждом вопросе начинает grep-ом по всему проекту — у меня есть для вас одна штука. SocratiCode — это MCP-сервер, который индексирует кодовую базу через Qdrant и даёт агенту нормальный поиск вместо построчного чтения. Разобрал, как он устроен внутри, потестировал на нашем монорепе и сравнил с обычным режимом Claude Code

https://habr.com/ru/articles/1031878/

#MCP #Claude_Code #векторный_поиск #Qdrant #Ollama #codebase_intelligence #AIагенты #RAG

#rag #aiагенты #codebase_intelligence #ollama #qdrant #векторный_поиск

Habr @[email protected] · 2026-05-05 · 20:12 UTC

SocratiCode: разбираю MCP-сервер, который даёт ИИ-агенту понимание кодовой базы

Если ваш ИИ-агент при каждом вопросе начинает grep-ом по всему проекту — у меня есть для вас одна штука. SocratiCode — это MCP-сервер, который индексирует кодовую базу через Qdrant и даёт агенту нормальный поиск вместо построчного чтения. Разобрал, как он устроен внутри, потестировал на нашем монорепе и сравнил с обычным режимом Claude Code

https://habr.com/ru/articles/1031878/

#MCP #Claude_Code #векторный_поиск #Qdrant #Ollama #codebase_intelligence #AIагенты #RAG

#rag #aiагенты #codebase_intelligence #ollama #qdrant #векторный_поиск

Habr @[email protected] · 2026-05-05 · 20:12 UTC

SocratiCode: разбираю MCP-сервер, который даёт ИИ-агенту понимание кодовой базы

Если ваш ИИ-агент при каждом вопросе начинает grep-ом по всему проекту — у меня есть для вас одна штука. SocratiCode — это MCP-сервер, который индексирует кодовую базу через Qdrant и даёт агенту нормальный поиск вместо построчного чтения. Разобрал, как он устроен внутри, потестировал на нашем монорепе и сравнил с обычным режимом Claude Code

https://habr.com/ru/articles/1031878/

#MCP #Claude_Code #векторный_поиск #Qdrant #Ollama #codebase_intelligence #AIагенты #RAG

#mcp #claude_code #векторный_поиск #qdrant #ollama #codebase_intelligence

Habr @[email protected] · 2026-04-24 · 09:22 UTC

Разворачиваем RAG на Java без боли: практический гайд

Всем привет! Недавно столкнулся с проблемой, что в настоящее время большая часть обучающих материалов по Retrieval‑Augmented Generation (RAG) сосредоточена на Python‑экосистеме (LangChain, LlamaIndex и тому подобное), а пошаговые руководства, которые показывают, как быстро собрать рабочее RAG‑приложение на чистом Java‑стеке , встречаются крайне редко. Эта статья представляет собой простое практическое руководство, где мы разберём весь процесс от настройки окружения до полного примера кода, чтобы даже начинающий Java‑разработчик мог развернуть RAG.

https://habr.com/ru/articles/1027426/

#RAG #Java #Spring_AI #Qdrant #Ollama #LLM #bgem3 #embeddings

#embeddings #bgem3 #llm #ollama #qdrant #spring_ai

Habr @[email protected] · 2026-04-24 · 09:22 UTC

Разворачиваем RAG на Java без боли: практический гайд

Всем привет! Недавно столкнулся с проблемой, что в настоящее время большая часть обучающих материалов по Retrieval‑Augmented Generation (RAG) сосредоточена на Python‑экосистеме (LangChain, LlamaIndex и тому подобное), а пошаговые руководства, которые показывают, как быстро собрать рабочее RAG‑приложение на чистом Java‑стеке , встречаются крайне редко. Эта статья представляет собой простое практическое руководство, где мы разберём весь процесс от настройки окружения до полного примера кода, чтобы даже начинающий Java‑разработчик мог развернуть RAG.

https://habr.com/ru/articles/1027426/

#RAG #Java #Spring_AI #Qdrant #Ollama #LLM #bgem3 #embeddings

#embeddings #bgem3 #llm #ollama #qdrant #spring_ai

Habr @[email protected] · 2026-04-24 · 09:22 UTC

Разворачиваем RAG на Java без боли: практический гайд

Всем привет! Недавно столкнулся с проблемой, что в настоящее время большая часть обучающих материалов по Retrieval‑Augmented Generation (RAG) сосредоточена на Python‑экосистеме (LangChain, LlamaIndex и тому подобное), а пошаговые руководства, которые показывают, как быстро собрать рабочее RAG‑приложение на чистом Java‑стеке , встречаются крайне редко. Эта статья представляет собой простое практическое руководство, где мы разберём весь процесс от настройки окружения до полного примера кода, чтобы даже начинающий Java‑разработчик мог развернуть RAG.

https://habr.com/ru/articles/1027426/

#RAG #Java #Spring_AI #Qdrant #Ollama #LLM #bgem3 #embeddings

#embeddings #bgem3 #llm #ollama #qdrant #spring_ai

Habr @[email protected] · 2026-04-24 · 09:22 UTC

Разворачиваем RAG на Java без боли: практический гайд

Всем привет! Недавно столкнулся с проблемой, что в настоящее время большая часть обучающих материалов по Retrieval‑Augmented Generation (RAG) сосредоточена на Python‑экосистеме (LangChain, LlamaIndex и тому подобное), а пошаговые руководства, которые показывают, как быстро собрать рабочее RAG‑приложение на чистом Java‑стеке , встречаются крайне редко. Эта статья представляет собой простое практическое руководство, где мы разберём весь процесс от настройки окружения до полного примера кода, чтобы даже начинающий Java‑разработчик мог развернуть RAG.

https://habr.com/ru/articles/1027426/

#RAG #Java #Spring_AI #Qdrant #Ollama #LLM #bgem3 #embeddings

#rag #java #spring_ai #qdrant #ollama #llm

michabbb @[email protected] · 2026-04-23 · 10:48 UTC

→ Mindlid: 20% lift in top-1 recall for wellness app

🔗 Available via #GeminiAPI & #VertexAI
Integrates with #LangChain, #LlamaIndex, #Haystack, #Weaviate, #Qdrant, #ChromaDB & Vector Search
🧪 Colab notebooks for Gemini API & Vertex AI ready to use

🌐
https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-embedding-2-generally-available/

#geminiapi #vertexai #langchain #llamaindex #haystack #weaviate

michabbb @[email protected] · 2026-04-23 · 10:48 UTC

→ Mindlid: 20% lift in top-1 recall for wellness app

🔗 Available via #GeminiAPI & #VertexAI
Integrates with #LangChain, #LlamaIndex, #Haystack, #Weaviate, #Qdrant, #ChromaDB & Vector Search
🧪 Colab notebooks for Gemini API & Vertex AI ready to use

🌐
https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-embedding-2-generally-available/

#geminiapi #vertexai #langchain #llamaindex #haystack #weaviate

michabbb @[email protected] · 2026-04-23 · 10:48 UTC

→ Mindlid: 20% lift in top-1 recall for wellness app

🔗 Available via #GeminiAPI & #VertexAI
Integrates with #LangChain, #LlamaIndex, #Haystack, #Weaviate, #Qdrant, #ChromaDB & Vector Search
🧪 Colab notebooks for Gemini API & Vertex AI ready to use

🌐
https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-embedding-2-generally-available/

#geminiapi #vertexai #langchain #llamaindex #haystack #weaviate

michabbb @[email protected] · 2026-04-23 · 10:48 UTC

→ Mindlid: 20% lift in top-1 recall for wellness app

🔗 Available via #GeminiAPI & #VertexAI
Integrates with #LangChain, #LlamaIndex, #Haystack, #Weaviate, #Qdrant, #ChromaDB & Vector Search
🧪 Colab notebooks for Gemini API & Vertex AI ready to use

🌐
https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-embedding-2-generally-available/

#chromadb #qdrant #weaviate #haystack #llamaindex #langchain

michabbb @[email protected] · 2026-04-23 · 10:48 UTC

→ Mindlid: 20% lift in top-1 recall for wellness app

🔗 Available via #GeminiAPI & #VertexAI
Integrates with #LangChain, #LlamaIndex, #Haystack, #Weaviate, #Qdrant, #ChromaDB & Vector Search
🧪 Colab notebooks for Gemini API & Vertex AI ready to use

🌐
https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-embedding-2-generally-available/

#geminiapi #vertexai #langchain #llamaindex #haystack #weaviate

Habr @[email protected] · 2026-04-17 · 13:12 UTC

Hybrid RAG для бизнеса: умный поиск по документам без облака и утечки данных

Крупная логистическая компания. Многолетний архив — договоры с перевозчиками, регламенты, переписка по инцидентам. Менеджер хочет узнать: были ли у нас претензии к этому контрагенту и на каких условиях мы с ним работали два года назад? Открывает почту, потом SharePoint, потом звонит в архив. Через час у него есть частичный ответ. Та же ситуация повторяется в таможне, банках и юридических фирмах. Данные накоплены — в PDF, Word, сканах, таблицах. Но корпоративная база знаний не отвечает на вопросы: нет инструмента, который понимал бы смысл запроса, а не просто искал по ключевым словам. Автоматизация документооборота упёрлась в потолок классических СЭД.

https://habr.com/ru/articles/1024696/

#Автоматизация_Документооборота #ИИ_для_Бизнеса #Нейросеть_Без_Облака #HybridRAG #Self_Hosted #LangGraph #Haystack #Qdrant #LlamaIndex #observability

#observability #llamaindex #qdrant #haystack #langgraph #self_hosted

Habr @[email protected] · 2026-04-17 · 13:12 UTC

Hybrid RAG для бизнеса: умный поиск по документам без облака и утечки данных

Крупная логистическая компания. Многолетний архив — договоры с перевозчиками, регламенты, переписка по инцидентам. Менеджер хочет узнать: были ли у нас претензии к этому контрагенту и на каких условиях мы с ним работали два года назад? Открывает почту, потом SharePoint, потом звонит в архив. Через час у него есть частичный ответ. Та же ситуация повторяется в таможне, банках и юридических фирмах. Данные накоплены — в PDF, Word, сканах, таблицах. Но корпоративная база знаний не отвечает на вопросы: нет инструмента, который понимал бы смысл запроса, а не просто искал по ключевым словам. Автоматизация документооборота упёрлась в потолок классических СЭД.

https://habr.com/ru/articles/1024696/

#Автоматизация_Документооборота #ИИ_для_Бизнеса #Нейросеть_Без_Облака #HybridRAG #Self_Hosted #LangGraph #Haystack #Qdrant #LlamaIndex #observability

#observability #llamaindex #qdrant #haystack #langgraph #self_hosted

Habr @[email protected] · 2026-04-17 · 13:12 UTC

Hybrid RAG для бизнеса: умный поиск по документам без облака и утечки данных

Крупная логистическая компания. Многолетний архив — договоры с перевозчиками, регламенты, переписка по инцидентам. Менеджер хочет узнать: были ли у нас претензии к этому контрагенту и на каких условиях мы с ним работали два года назад? Открывает почту, потом SharePoint, потом звонит в архив. Через час у него есть частичный ответ. Та же ситуация повторяется в таможне, банках и юридических фирмах. Данные накоплены — в PDF, Word, сканах, таблицах. Но корпоративная база знаний не отвечает на вопросы: нет инструмента, который понимал бы смысл запроса, а не просто искал по ключевым словам. Автоматизация документооборота упёрлась в потолок классических СЭД.

https://habr.com/ru/articles/1024696/

#Автоматизация_Документооборота #ИИ_для_Бизнеса #Нейросеть_Без_Облака #HybridRAG #Self_Hosted #LangGraph #Haystack #Qdrant #LlamaIndex #observability

#observability #llamaindex #qdrant #haystack #langgraph #self_hosted

Habr @[email protected] · 2026-04-17 · 13:12 UTC

Hybrid RAG для бизнеса: умный поиск по документам без облака и утечки данных

Крупная логистическая компания. Многолетний архив — договоры с перевозчиками, регламенты, переписка по инцидентам. Менеджер хочет узнать: были ли у нас претензии к этому контрагенту и на каких условиях мы с ним работали два года назад? Открывает почту, потом SharePoint, потом звонит в архив. Через час у него есть частичный ответ. Та же ситуация повторяется в таможне, банках и юридических фирмах. Данные накоплены — в PDF, Word, сканах, таблицах. Но корпоративная база знаний не отвечает на вопросы: нет инструмента, который понимал бы смысл запроса, а не просто искал по ключевым словам. Автоматизация документооборота упёрлась в потолок классических СЭД.

https://habr.com/ru/articles/1024696/

#Автоматизация_Документооборота #ИИ_для_Бизнеса #Нейросеть_Без_Облака #HybridRAG #Self_Hosted #LangGraph #Haystack #Qdrant #LlamaIndex #observability

#автоматизация_документооборота #ии_для_бизнеса #нейросеть_без_облака #hybridrag #self_hosted #langgraph

Habr @[email protected] · 2026-03-25 · 09:22 UTC

Юридическое поле экспериментов для RAG

Можно ли делать RAG на MacStudio M3 Ultra? CAG - убийца RAG? Самый лучший RAG от OpenAI и Grok? Ответы на эти вопросы мы узнали во время участия в соревновании Agentic RAG Legal Challenge . Стоит отметить хорошую организацию соревнования и продуманные метрики. Более 300 команд со всего мира. Ответы на вопросы - под катом

https://habr.com/ru/articles/1014690/

#RAG #CAG #ARLC_2026 #хакатон #выгорание #qdrant #opensourse #llmагент #безумный_план #openrouter

#openrouter #безумный_план #llmагент #opensourse #qdrant #выгорание

Habr @[email protected] · 2026-03-25 · 09:22 UTC

Юридическое поле экспериментов для RAG

Можно ли делать RAG на MacStudio M3 Ultra? CAG - убийца RAG? Самый лучший RAG от OpenAI и Grok? Ответы на эти вопросы мы узнали во время участия в соревновании Agentic RAG Legal Challenge . Стоит отметить хорошую организацию соревнования и продуманные метрики. Более 300 команд со всего мира. Ответы на вопросы - под катом

https://habr.com/ru/articles/1014690/

#RAG #CAG #ARLC_2026 #хакатон #выгорание #qdrant #opensourse #llmагент #безумный_план #openrouter

#openrouter #безумный_план #llmагент #opensourse #qdrant #выгорание

Habr @[email protected] · 2026-03-25 · 09:22 UTC

Юридическое поле экспериментов для RAG

Можно ли делать RAG на MacStudio M3 Ultra? CAG - убийца RAG? Самый лучший RAG от OpenAI и Grok? Ответы на эти вопросы мы узнали во время участия в соревновании Agentic RAG Legal Challenge . Стоит отметить хорошую организацию соревнования и продуманные метрики. Более 300 команд со всего мира. Ответы на вопросы - под катом

https://habr.com/ru/articles/1014690/

#RAG #CAG #ARLC_2026 #хакатон #выгорание #qdrant #opensourse #llmагент #безумный_план #openrouter

#openrouter #безумный_план #llmагент #opensourse #qdrant #выгорание

Habr @[email protected] · 2026-03-25 · 09:22 UTC

Юридическое поле экспериментов для RAG

Можно ли делать RAG на MacStudio M3 Ultra? CAG - убийца RAG? Самый лучший RAG от OpenAI и Grok? Ответы на эти вопросы мы узнали во время участия в соревновании Agentic RAG Legal Challenge . Стоит отметить хорошую организацию соревнования и продуманные метрики. Более 300 команд со всего мира. Ответы на вопросы - под катом

https://habr.com/ru/articles/1014690/

#RAG #CAG #ARLC_2026 #хакатон #выгорание #qdrant #opensourse #llmагент #безумный_план #openrouter

#rag #cag #arlc_2026 #хакатон #выгорание #qdrant

Habr @[email protected] · 2026-03-24 · 19:52 UTC

Agentic RAG Challenge. Я знаю что вы искали прошлым летом…

В данной статье хотел бы поделиться опытом участия в хакатоне Agentic Legal RAG Challenge 2026 . Наша команда называется "Sparks of intelligence".

https://habr.com/ru/articles/1014520/

#rag #qdrant #llamaindex #ии_агент #векторный_поиск #чанкинг #гибридный_поиск #векторная_база_данных #хакатон

#хакатон #векторная_база_данных #гибридный_поиск #чанкинг #векторный_поиск #ии_агент

Habr @[email protected] · 2026-03-24 · 19:52 UTC

Agentic RAG Challenge. Я знаю что вы искали прошлым летом…

В данной статье хотел бы поделиться опытом участия в хакатоне Agentic Legal RAG Challenge 2026 . Наша команда называется "Sparks of intelligence".

https://habr.com/ru/articles/1014520/

#rag #qdrant #llamaindex #ии_агент #векторный_поиск #чанкинг #гибридный_поиск #векторная_база_данных #хакатон

#хакатон #векторная_база_данных #гибридный_поиск #чанкинг #векторный_поиск #ии_агент

Habr @[email protected] · 2026-03-24 · 19:52 UTC

Agentic RAG Challenge. Я знаю что вы искали прошлым летом…

В данной статье хотел бы поделиться опытом участия в хакатоне Agentic Legal RAG Challenge 2026 . Наша команда называется "Sparks of intelligence".

https://habr.com/ru/articles/1014520/

#rag #qdrant #llamaindex #ии_агент #векторный_поиск #чанкинг #гибридный_поиск #векторная_база_данных #хакатон

#хакатон #векторная_база_данных #гибридный_поиск #чанкинг #векторный_поиск #ии_агент

Habr @[email protected] · 2026-03-24 · 19:52 UTC

Agentic RAG Challenge. Я знаю что вы искали прошлым летом…

В данной статье хотел бы поделиться опытом участия в хакатоне Agentic Legal RAG Challenge 2026 . Наша команда называется "Sparks of intelligence".

https://habr.com/ru/articles/1014520/

#rag #qdrant #llamaindex #ии_агент #векторный_поиск #чанкинг #гибридный_поиск #векторная_база_данных #хакатон

#rag #qdrant #llamaindex #ии_агент #векторный_поиск #чанкинг

Linux Professional Institute @LPI · 2026-03-23 · 14:49 UTC

Databases for #AI: Should you use a vector #database? 🤔

This article compares #opensource projects competing to handle modern #AI workloads, including #machinelearning and #LLMs. Discover which databases best meet today’s AI challenges: https://lpi.org/636x

(Disclaimer: This post contains an AI-generated image.)

#AndyOram #AI #vectordatabase #machinelearning #LLMs #SQL #opensource #hybridsearch #generativeAI #MariaDB #MongoDB #Milvus #Qdrant #Weaviate #Vespa #ChromaDB #LanceDB

#ai #database #opensource #machinelearning #llms #andyoram

Linux Professional Institute @[email protected] · 2026-03-23 · 14:49 UTC

Databases for #AI: Should you use a vector #database? 🤔

This article compares #opensource projects competing to handle modern #AI workloads, including #machinelearning and #LLMs. Discover which databases best meet today’s AI challenges: https://lpi.org/636x

(Disclaimer: This post contains an AI-generated image.)

#AndyOram #AI #vectordatabase #machinelearning #LLMs #SQL #opensource #hybridsearch #generativeAI #MariaDB #MongoDB #Milvus #Qdrant #Weaviate #Vespa #ChromaDB #LanceDB

#ai #database #opensource #machinelearning #llms #andyoram

Linux Professional Institute @[email protected] · 2026-03-23 · 14:49 UTC

Databases for #AI: Should you use a vector #database? 🤔

This article compares #opensource projects competing to handle modern #AI workloads, including #machinelearning and #LLMs. Discover which databases best meet today’s AI challenges: https://lpi.org/636x

(Disclaimer: This post contains an AI-generated image.)

#AndyOram #AI #vectordatabase #machinelearning #LLMs #SQL #opensource #hybridsearch #generativeAI #MariaDB #MongoDB #Milvus #Qdrant #Weaviate #Vespa #ChromaDB #LanceDB

#ai #database #opensource #machinelearning #llms #andyoram

Linux Professional Institute @[email protected] · 2026-03-23 · 14:49 UTC

Databases for #AI: Should you use a vector #database? 🤔

This article compares #opensource projects competing to handle modern #AI workloads, including #machinelearning and #LLMs. Discover which databases best meet today’s AI challenges: https://lpi.org/636x

(Disclaimer: This post contains an AI-generated image.)

#AndyOram #AI #vectordatabase #machinelearning #LLMs #SQL #opensource #hybridsearch #generativeAI #MariaDB #MongoDB #Milvus #Qdrant #Weaviate #Vespa #ChromaDB #LanceDB

#lancedb #chromadb #vespa #weaviate #qdrant #milvus

Linux Professional Institute @[email protected] · 2026-03-23 · 14:49 UTC

Databases for #AI: Should you use a vector #database? 🤔

This article compares #opensource projects competing to handle modern #AI workloads, including #machinelearning and #LLMs. Discover which databases best meet today’s AI challenges: https://lpi.org/636x

(Disclaimer: This post contains an AI-generated image.)

#AndyOram #AI #vectordatabase #machinelearning #LLMs #SQL #opensource #hybridsearch #generativeAI #MariaDB #MongoDB #Milvus #Qdrant #Weaviate #Vespa #ChromaDB #LanceDB

#ai #database #opensource #machinelearning #llms #andyoram

Habr @[email protected] · 2026-03-20 · 16:02 UTC

Память ИИ‑агентов: как агенты запоминают, забывают и учатся

Память ИИ‑агентов: как агенты запоминают, забывают и учатся Всем привет! Продолжаю рассказывать и делиться своим опытом создания и внедрения ИИ-агентов. Сегодня давайте поговорим про память ИИ-агентов. Я поделюсь какие типы памяти использую чаще всего, поговорим про базовый минимум без которого нет смысла пытаться строить ИИ-агентов. Начнём с того как вообще работает контекстное окно и почему его не хватает, потом разберём какие типы памяти бывают, как они хранятся и как подгружаются в контекст.

https://habr.com/ru/articles/1012894/

#openai #claude_code #memory_management #rag #rag_pipeline #память_ии #claude_ai #qdrant #ииагенты #ииассистент

#ииассистент #ииагенты #qdrant #claude_ai #память_ии #rag_pipeline

Habr @[email protected] · 2026-03-20 · 16:02 UTC

Память ИИ‑агентов: как агенты запоминают, забывают и учатся

Память ИИ‑агентов: как агенты запоминают, забывают и учатся Всем привет! Продолжаю рассказывать и делиться своим опытом создания и внедрения ИИ-агентов. Сегодня давайте поговорим про память ИИ-агентов. Я поделюсь какие типы памяти использую чаще всего, поговорим про базовый минимум без которого нет смысла пытаться строить ИИ-агентов. Начнём с того как вообще работает контекстное окно и почему его не хватает, потом разберём какие типы памяти бывают, как они хранятся и как подгружаются в контекст.

https://habr.com/ru/articles/1012894/

#openai #claude_code #memory_management #rag #rag_pipeline #память_ии #claude_ai #qdrant #ииагенты #ииассистент

#ииассистент #ииагенты #qdrant #claude_ai #память_ии #rag_pipeline

Habr @[email protected] · 2026-03-20 · 16:02 UTC

Память ИИ‑агентов: как агенты запоминают, забывают и учатся

Память ИИ‑агентов: как агенты запоминают, забывают и учатся Всем привет! Продолжаю рассказывать и делиться своим опытом создания и внедрения ИИ-агентов. Сегодня давайте поговорим про память ИИ-агентов. Я поделюсь какие типы памяти использую чаще всего, поговорим про базовый минимум без которого нет смысла пытаться строить ИИ-агентов. Начнём с того как вообще работает контекстное окно и почему его не хватает, потом разберём какие типы памяти бывают, как они хранятся и как подгружаются в контекст.

https://habr.com/ru/articles/1012894/

#openai #claude_code #memory_management #rag #rag_pipeline #память_ии #claude_ai #qdrant #ииагенты #ииассистент

#ииассистент #ииагенты #qdrant #claude_ai #память_ии #rag_pipeline