#qdrant — Public Fediverse posts
Live and recent posts from across the Fediverse tagged #qdrant, aggregated by home.social.
-
Как мы довели поиск товаров по изображению до 98% совпадений: FastAPI, DINOv2, Qdrant и поиск на фото полки
Поиск товара по изображению кажется простой задачей — ровно до момента, пока не сталкиваешься с реальным каталогом . В теории все выглядит аккуратно: берем фото, считаем embedding, ищем ближайшие вектора, возвращаем совпадения. На практике начинаются нюансы: у товара несколько изображений, ракурсы отличаются, фон мешает, каталог обновляется постоянно, а бизнес ждет не исследовательский прототип, а сервис, который можно поставить в production. С вами старший программист в Fix Price Константин Репин. И в этом материале разберу, как мы строили сервис визуального поиска товаров, какие инженерные решения реально повлияли на качество и почему текущий результат в 98% совпадений получился не из-за одной удачной модели, а из-за правильно собранного пайплайна.
https://habr.com/ru/companies/fix_price/articles/1034664/
#поиск_товаров #FastAPI #dinov2 #qdrant #визуальные_эмбеддинги #векторный_поиск
-
SocratiCode: разбираю MCP-сервер, который даёт ИИ-агенту понимание кодовой базы
Если ваш ИИ-агент при каждом вопросе начинает grep-ом по всему проекту — у меня есть для вас одна штука. SocratiCode — это MCP-сервер, который индексирует кодовую базу через Qdrant и даёт агенту нормальный поиск вместо построчного чтения. Разобрал, как он устроен внутри, потестировал на нашем монорепе и сравнил с обычным режимом Claude Code
https://habr.com/ru/articles/1031878/
#MCP #Claude_Code #векторный_поиск #Qdrant #Ollama #codebase_intelligence #AIагенты #RAG
-
Разворачиваем RAG на Java без боли: практический гайд
Всем привет! Недавно столкнулся с проблемой, что в настоящее время большая часть обучающих материалов по Retrieval‑Augmented Generation (RAG) сосредоточена на Python‑экосистеме (LangChain, LlamaIndex и тому подобное), а пошаговые руководства, которые показывают, как быстро собрать рабочее RAG‑приложение на чистом Java‑стеке , встречаются крайне редко. Эта статья представляет собой простое практическое руководство, где мы разберём весь процесс от настройки окружения до полного примера кода, чтобы даже начинающий Java‑разработчик мог развернуть RAG.
https://habr.com/ru/articles/1027426/
#RAG #Java #Spring_AI #Qdrant #Ollama #LLM #bgem3 #embeddings
-
→ Mindlid: 20% lift in top-1 recall for wellness app
🔗 Available via #GeminiAPI & #VertexAI
Integrates with #LangChain, #LlamaIndex, #Haystack, #Weaviate, #Qdrant, #ChromaDB & Vector Search
🧪 Colab notebooks for Gemini API & Vertex AI ready to use -
→ Mindlid: 20% lift in top-1 recall for wellness app
🔗 Available via #GeminiAPI & #VertexAI
Integrates with #LangChain, #LlamaIndex, #Haystack, #Weaviate, #Qdrant, #ChromaDB & Vector Search
🧪 Colab notebooks for Gemini API & Vertex AI ready to use -
→ Mindlid: 20% lift in top-1 recall for wellness app
🔗 Available via #GeminiAPI & #VertexAI
Integrates with #LangChain, #LlamaIndex, #Haystack, #Weaviate, #Qdrant, #ChromaDB & Vector Search
🧪 Colab notebooks for Gemini API & Vertex AI ready to use -
→ Mindlid: 20% lift in top-1 recall for wellness app
🔗 Available via #GeminiAPI & #VertexAI
Integrates with #LangChain, #LlamaIndex, #Haystack, #Weaviate, #Qdrant, #ChromaDB & Vector Search
🧪 Colab notebooks for Gemini API & Vertex AI ready to use -
→ Mindlid: 20% lift in top-1 recall for wellness app
🔗 Available via #GeminiAPI & #VertexAI
Integrates with #LangChain, #LlamaIndex, #Haystack, #Weaviate, #Qdrant, #ChromaDB & Vector Search
🧪 Colab notebooks for Gemini API & Vertex AI ready to use -
Hybrid RAG для бизнеса: умный поиск по документам без облака и утечки данных
Крупная логистическая компания. Многолетний архив — договоры с перевозчиками, регламенты, переписка по инцидентам. Менеджер хочет узнать: были ли у нас претензии к этому контрагенту и на каких условиях мы с ним работали два года назад? Открывает почту, потом SharePoint, потом звонит в архив. Через час у него есть частичный ответ. Та же ситуация повторяется в таможне, банках и юридических фирмах. Данные накоплены — в PDF, Word, сканах, таблицах. Но корпоративная база знаний не отвечает на вопросы: нет инструмента, который понимал бы смысл запроса, а не просто искал по ключевым словам. Автоматизация документооборота упёрлась в потолок классических СЭД.
https://habr.com/ru/articles/1024696/
#Автоматизация_Документооборота #ИИ_для_Бизнеса #Нейросеть_Без_Облака #HybridRAG #Self_Hosted #LangGraph #Haystack #Qdrant #LlamaIndex #observability
-
Юридическое поле экспериментов для RAG
Можно ли делать RAG на MacStudio M3 Ultra? CAG - убийца RAG? Самый лучший RAG от OpenAI и Grok? Ответы на эти вопросы мы узнали во время участия в соревновании Agentic RAG Legal Challenge . Стоит отметить хорошую организацию соревнования и продуманные метрики. Более 300 команд со всего мира. Ответы на вопросы - под катом
https://habr.com/ru/articles/1014690/
#RAG #CAG #ARLC_2026 #хакатон #выгорание #qdrant #opensourse #llmагент #безумный_план #openrouter
-
Databases for #AI: Should you use a vector #database? 🤔
This article compares #opensource projects competing to handle modern #AI workloads, including #machinelearning and #LLMs. Discover which databases best meet today’s AI challenges: https://lpi.org/636x
(Disclaimer: This post contains an AI-generated image.)
#AndyOram #AI #vectordatabase #machinelearning #LLMs #SQL #opensource #hybridsearch #generativeAI #MariaDB #MongoDB #Milvus #Qdrant #Weaviate #Vespa #ChromaDB #LanceDB
-
Память ИИ‑агентов: как агенты запоминают, забывают и учатся
Память ИИ‑агентов: как агенты запоминают, забывают и учатся Всем привет! Продолжаю рассказывать и делиться своим опытом создания и внедрения ИИ-агентов. Сегодня давайте поговорим про память ИИ-агентов. Я поделюсь какие типы памяти использую чаще всего, поговорим про базовый минимум без которого нет смысла пытаться строить ИИ-агентов. Начнём с того как вообще работает контекстное окно и почему его не хватает, потом разберём какие типы памяти бывают, как они хранятся и как подгружаются в контекст.
https://habr.com/ru/articles/1012894/
#openai #claude_code #memory_management #rag #rag_pipeline #память_ии #claude_ai #qdrant #ииагенты #ииассистент
-
via @dotnet : Vector Data in .NET – Building Blocks for AI Part 2
https://ift.tt/VtJUvye
#VectorData #NET #AI #BuildingBlocks #SemanticSearch #RAG #Embedding #Embeddings #VectorDatabase #Qdrant #Redis #CosmosDB #SQLServer #PostgreSQL #SQLite #InMemory #VectorSto… -
AI & RAG. Помощник по техническим вопросам систем управления освещением
Свою первую программу я написал в 1988 году на калькуляторе МК52. Очень хотелось программировать и даже максимально странный интерфейс не останавливал. Утекло почти 40 лет. Были Атари, Синклеры, 286 IBM, Интернет, смартофоны. Но все эти технологии входили как-то постепенно, приспосабливаясь и без шока. AI ворвался в жизнь бывалого ИТшника как пыльным мешком по голове. После первого шока, скормленных Дипсику результатов анализов, идей подарков, профессиональная “чуйка” потребовала придумать новой чудо-технологии боевое применение в том, чем я занимаюсь каждый день на протяжении всей сознательной жизни. Фокус группы не сформулировали внятного предложения куда погрузить AI - было решен что потрачу время и часы штатных программистов на то, чтобы уменьшить свою боль - держать в голове кучу технических нюансов, документации, кейсов и лайвхаков.
https://habr.com/ru/articles/983974/
#RAG #Qdrant #FRIDA #эмбеддинг #Qwen #локальная_LLM #техническая_документация #Claude #системы_управления_освещением #AIfirst
-
Базовый RAG-компонент для локального семантического поиска на Питоне
quad_rag_core — лёгкое Python-ядро для локального RAG, которое автоматически отслеживает изменения в папках, индексирует их в Qdrant и поддерживает эмбеддинги в актуальном состоянии. Изначально проект задумывался как плагин для MCP (Model Context Protocol), но стал универсальной основой для любой системы локального семантического поиска. Зачем это нужно В процессе работы с кодовой базой через LLM-агентов и при необходимости локального семантического поиска по файлам проекта обнаружилась проблема. Инструменты агентской разработки вроде Kilo Code предоставляют встроенную функцию семантического поиска, но в компании заявляют что в будущем эта функциональность может стать платной. Сразу задумался о том чтобы сделать свою подсистему поиска. Простые запросы к MCP-серверу на поиск и обновление тут не подойдут - система поиска должна иметь полный контроль над контекстом - она должна автоматически узнавать, что файл удалён, функция изменена или добавлен новый документ, без необходимости перезапуска индексации. От идеи к архитектуре В начале планировался простой MCP-сервер, который принимает команды поиска и обновления, индексирует текстовые файлы и PDF, использует Qdrant как векторное хранилище и эмбеддит локально. В ходе проектирования стало понятно: вся логика отслеживания файлов, парсинга, чанкинга и синхронизации с Qdrant — это переиспользуемое ядро, а не часть MCP-протокола. Так появился quad_rag_core — отдельный Python-модуль, который не знает ничего про MCP или другие внешние интерфейсы, но готов к ним подключаться.
https://habr.com/ru/articles/982476/
#rag #rag_ai #семантический_поиск #middleware #python #qdrant #embeddings
-
Нейропоисковик на 17 миллионов картинок: OpenCLIP, Qdrant и ZeroTier вместо облаков
Как сделать свой аналог Pinterest, если у вас нет бюджета корпорации, но есть 4 ТБ картинок (17 миллионов штук) и желание искать по ним не просто по тегам, а по визуальному стилю? В статье — опыт построения распределенной системы поиска из подручных средств. Разбираем архитектуру: — Гибридное хранение: Backblaze B2 (холодное) + Домашний сервер (вычисления). — Сеть: Как ZeroTier объединил разрозненные ноды в одну Mesh-сеть без белых IP. — Векторный поиск: Как уместить 17 миллионов векторов OpenCLIP ViT-H/14 в 32 ГБ RAM с помощью Qdrant и квантизации. — Оптимизация: Почему поиск работает за 5 мс, а загрузка метаданных тормозила до 3 секунд, и как PostgreSQL спас ситуацию. Полный разбор ETL-пайплайна и экономики домашнего HighLoad-проекта.
https://habr.com/ru/articles/981330/
#python #векторные_базы_данных #qdrant #поиск_изображений #clip #zerotier #оптимизация #petproject #diy #selfhosting
-
Как и зачем мы разработали систему анализа аномальных логов. Кейс MWS
Привет, Хабр! Меня зовут Андрей Басов, я руководитель команды технической поддержки стрима корпоративных продуктов и сервисов в MWS. Вместе со своими коллегами — Тимуром Хабибулиным (data scientist) и Рафисом Ганеевым (senior devops engineer) — занимаюсь технической поддержкой и сопровождением продуктов линейки Partner Experience Platform. Чтобы улучшить качество наших сервисов, через которые МТС взаимодействует с партнерами, мы вынуждены постоянно внедрять новые решения, растить продукты и развивать их архитектуру, при этом нам важно обеспечивать надежность и стабильность работы ИТ-систем. Это не всегда дается легко, ведь объемы данных растут, и их нужно эффективно обрабатывать. Одной из основных проблем становится анализ логов — текстовых записей. В нашем случае они фиксируют события в работе систем, которые созданы за 25+ лет работы компании, а еще у них различные стеки и архитектурные подходы. Объемы данных настолько велики, что проанализировать вручную (например, в OpenSearch/Kibana) даже один продукт практически невозможно, иначе нам пришлось бы просматривать миллионы строк логов каждый день. Поэтому мы решили разработать систему, которая позволила бы автоматически выявлять в логах аномалии — события, не свойственные нормальному функционированию системы. Например, это могут быть следы багов, вызванных новыми релизами, или другие непредвиденные происшествия. Что из этого вышло — расскажу дальше.
https://habr.com/ru/companies/ru_mts/articles/977624/
#машинное_обучение #qdrant #observability #python #mws #Векторный_поиск #Кластеризация #HDBSCAN #bgem3 #микросервисы
-
Векторный поиск: как выбрать систему и не пожалеть
От поиска по архивам документов и медиафайлам до рекомендательных систем и AI приложений — всюду работают эмбеддинги и векторный поиск. Но когда дело доходит до выбора конкретного инструмента, глаза разбегаются: Qdrant, Milvus, Weaviate, Redis, Elasticsearch, Pgvector… Если вы: - планируете внедрять семантический поиск в свой продукт, - выбираете между проверенными временем БД и специализированными системами обработки векторов, - ищете независисые бенчмарки, то этот материал — для вас. Мы разберем основные концепции векторного поиска, сравним популярные open-source решения и протестируем скорость их работы с учетом загрузки процессора и памяти.
https://habr.com/ru/companies/tensor/articles/970480/
#векторный_поиск #pgvector #pgvectors #milvus #weaviate #redis #qdrant #vespa #elasticsearch #chroma
-
Выбираем open-source эмбеддинг-модель для AI-консультанта на русском (RAG-подход)
Разрабатывая AI-консультантов и ассистентов на базе RAG-архитектуры, работающих с корпоративными базами знаний на русском языке, мы столкнулись с вопросом: какие открытые эмбеддинг-модели дают лучший баланс качества семантического поиска на русском и скорости работы. Особенно это актуально, когда запросы и документы русскоязычные, но внутри часто попадаются фрагменты кода/SQL и англоязычной терминологии. Мы прогнали 9 open-source эмбеддинг-моделей через несколько тестов, включающих проверки:
-
Выбираем векторную БД для AI-агентов и RAG: большой обзор баз данных и поиск смысла
В этой статье я сделал обзор основных векторных баз данных: Milvus, Qdrant, Weaviate, ChromaDB, pgvector, Redis, pgvectorscale, LanceDB, ClickHouse, Vespa, Marqo, ElasticSearch. Если вы запутались в разнообразии векторных баз данных или хочется верхнеуровнево понимать как они устроены, чем отличаются и для чего вообще нужны, то эта статья будет очень полезна. Мы пошагово соберем все ожидания от векторных БД, посмотрим бенчмарки, а затем попробуем собрать все воедино.
https://habr.com/ru/articles/961088/
#базы_данных #milvus #pgvector #qdrant #redis #chroma #chromadb #ииагенты #aiагенты #LLM
-
Volle AI-Souveränität mit Infinito.Nexus
Mit Stolz können wir verkünden: Infinito.Nexus erreicht nun volle Souveränität im Bereich Künstliche Intelligenz. Durch die Integration von Open WebUI und Flowise bieten wir leistungsstarke Werkzeuge, mit denen Unternehmen ihre eigenen Daten sicher, lokal und DSGVO-konform in KI-Workflows einbinden können – ohne dass vertrauliche Informationen jemals die eigenen Server verlassen. […]https://blog.infinito.nexus/blog/2025/09/23/volle-ai-souveraenitaet-mit-infinito-nexus/
-
RAG и векторные БД: НЕ Сизифов LLM на Java и Spring Ai
Привет! Меня зовут Бромбин Андрей, и сегодня я разберу на практике, что такое RAG-системы и как они помогают улучшать поиск. Покажу, как использовать Spring AI, векторные базы данных и LLM. Ты получишь теорию и пример реализации на Java и Spring Boot – от идеи до работающего сервиса. Без сложных формул – только чёткие объяснения и код. Обновить резюме
https://habr.com/ru/companies/ruvds/articles/924100/
#spring_ai #исскуственный_интеллект #qdrant #semantic_search #retrieval_augmented_generation #vector_database #large_language_model #java #ruvds_статьи #космотекст
-
Тест-кейсы на автопилоте: как Spring AI и Atlassian MCP упрощают жизнь тестировщика
Тест-кейсы перестанут быть твоей головной болью и болью твоей команды. Нужно просто перестать их писать. Путь от спецификации до коллекции в тест-менеджере может быть пройден за минуту. Достаточно принимать по одной чайной ложке... Или попытаться воспроизвести цепочку задач с помощью AI: модель легким движением промпта превращается в QA, нарезает спеку на чанки, отдавая тебе список из структурированных данных, которые ты шлешь далее в свой тест-менеджер. Пишу о своих изысканиях в области автоматизации рутинных процессов с помощью Spring AI, Atlassian MCP, Qdrant, OpenAI, Allure TestOps.
https://habr.com/ru/articles/923806/
#qa #qa_automation #sping #ai #mcp #qdrant #allure_testops #atlassian
-
Векторные БД vs Точность — часть 2
В первой части из тестов стало понятно, что в векторном поиске с терминами что-то не так. И точность достаточно низкая для корректной работы RAG (retrieval augmentation generation). Давайте попробуем гибридный поиск и посмотрим, что из этого получится.
https://habr.com/ru/articles/817173/
#llm #векторные_базы_данных #retrieval_augmented_generation #chroma #weaviate #qdrant
-
There are so many #vectordatabase companies now (#Chroma, #Qdrant, #Weaviate, #Pinecone, #Zilliz to name a few) that it feels like a big #AI bubble is growing. All you need for a vector database is basically an embedding model and a retrieval method based on a distance metric for the vectors like cosine similarity. In Berlin alone there are two companies - mixedbread.ai and jina.ai - who only work on embedding models. Is this an AI bubble which is going to burst or something different?
-
We were not accepted into Google Summer of Code. So, we started our own
https://qdrant.tech/blog/qdrant-summer-of-code-24/
#ycombinator #vector_search_engine #neural_network #matching #SaaS #approximate_nearest_neighbor_search #image_search #recommender_system #vectors #knn_algorithm #hnsw #vector_search #embeddings #similarity #simaes_networks #BERT #transformer #word2vec #fasttext #qdrant -
Qdrant, the Vector Search Database, raised $28M in a Series A round
https://qdrant.tech/blog/series-a-funding-round/
#ycombinator #vector_search_engine #neural_network #matching #SaaS #approximate_nearest_neighbor_search #image_search #recommender_system #vectors #knn_algorithm #hnsw #vector_search #embeddings #similarity #simaes_networks #BERT #transformer #word2vec #fasttext #qdrant -
On a roll: Qdrant brings sparse vectors, discovery search and custom sharding
https://qdrant.tech/articles/qdrant-1.7.x/
#ycombinator #vector_search #new_features #sparse_vectors #discovery #exploration #custom_sharding #snapshot_based_shard_transfer #hybrid_search #bm25 #tfidf #splade #qdrant