#векторные_базы_данных — Public Fediverse posts on home.social

Habr @[email protected] · 2026-04-29 · 18:42 UTC

[Перевод] Пять документов ломают ваш RAG: где реальная уязвимость и что с ней делать

RAG часто воспринимают как аккуратный способ «заземлить» LLM на документах и снизить риск галлюцинаций. Но у этой архитектуры есть менее очевидная проблема: контекст из базы знаний обычно считается доверенным, хотя именно через него в модель могут попасть вредоносные инструкции. В статье разбираем, как несколько отравленных документов могут повлиять на ответы системы, почему эмбеддинги нельзя считать безопасной абстракцией и какие уровни защиты нужны, если RAG используется не в демо, а в реальном продакшене. К рискам RAG

https://habr.com/ru/companies/otus/articles/1029742/

#RAG #LLM #промптинъекции #безопасность_llm #отравление_данных #векторные_базы_данных #эмбеддинги #OWASP_LLM_Top_10

#owasp_llm_top_10 #эмбеддинги #векторные_базы_данных #отравление_данных #безопасность_llm #промптинъекции

Habr @[email protected] · 2026-04-27 · 16:42 UTC

[Перевод] Практическое руководство по инжинирингу контекста для AI-ассистентов

Каждая новая сессия с AI-ассистентом для разработки обнуляет накопленный контекст: инструменты мощные, но по своей природе «забывчивые». В итоге мы снова и снова проговариваем стек, соглашения и ограничения, тратя время на восстановление того, что уже было известно вчера. В статье разберемся, как превратить это слабое место в управляемый ресурс: от простых файлов правил до полноценных слоёв памяти и инфраструктуры, которые позволяют ассистенту работать с учётом накопленного опыта.

https://habr.com/ru/companies/otus/articles/1028442/

#LLM #инжиниринг_контекста #память_AI #контекстное_окно #rag #промптинжиниринг #LLMинженер #векторные_базы_данных #AIассистенты

#aiассистенты #векторные_базы_данных #llmинженер #промптинжиниринг #rag #контекстное_окно

Habr @[email protected] · 2026-04-27 · 16:42 UTC

[Перевод] Практическое руководство по инжинирингу контекста для AI-ассистентов

Каждая новая сессия с AI-ассистентом для разработки обнуляет накопленный контекст: инструменты мощные, но по своей природе «забывчивые». В итоге мы снова и снова проговариваем стек, соглашения и ограничения, тратя время на восстановление того, что уже было известно вчера. В статье разберемся, как превратить это слабое место в управляемый ресурс: от простых файлов правил до полноценных слоёв памяти и инфраструктуры, которые позволяют ассистенту работать с учётом накопленного опыта.

https://habr.com/ru/companies/otus/articles/1028442/

#LLM #инжиниринг_контекста #память_AI #контекстное_окно #rag #промптинжиниринг #LLMинженер #векторные_базы_данных #AIассистенты

#aiассистенты #векторные_базы_данных #llmинженер #промптинжиниринг #rag #контекстное_окно

Habr @[email protected] · 2026-04-27 · 16:42 UTC

[Перевод] Практическое руководство по инжинирингу контекста для AI-ассистентов

Каждая новая сессия с AI-ассистентом для разработки обнуляет накопленный контекст: инструменты мощные, но по своей природе «забывчивые». В итоге мы снова и снова проговариваем стек, соглашения и ограничения, тратя время на восстановление того, что уже было известно вчера. В статье разберемся, как превратить это слабое место в управляемый ресурс: от простых файлов правил до полноценных слоёв памяти и инфраструктуры, которые позволяют ассистенту работать с учётом накопленного опыта.

https://habr.com/ru/companies/otus/articles/1028442/

#LLM #инжиниринг_контекста #память_AI #контекстное_окно #rag #промптинжиниринг #LLMинженер #векторные_базы_данных #AIассистенты

#aiассистенты #векторные_базы_данных #llmинженер #промптинжиниринг #rag #контекстное_окно

Habr @[email protected] · 2026-04-27 · 16:42 UTC

[Перевод] Практическое руководство по инжинирингу контекста для AI-ассистентов

Каждая новая сессия с AI-ассистентом для разработки обнуляет накопленный контекст: инструменты мощные, но по своей природе «забывчивые». В итоге мы снова и снова проговариваем стек, соглашения и ограничения, тратя время на восстановление того, что уже было известно вчера. В статье разберемся, как превратить это слабое место в управляемый ресурс: от простых файлов правил до полноценных слоёв памяти и инфраструктуры, которые позволяют ассистенту работать с учётом накопленного опыта.

https://habr.com/ru/companies/otus/articles/1028442/

#LLM #инжиниринг_контекста #память_AI #контекстное_окно #rag #промптинжиниринг #LLMинженер #векторные_базы_данных #AIассистенты

#llm #инжиниринг_контекста #память_ai #контекстное_окно #rag #промптинжиниринг

Habr @[email protected] · 2026-04-13 · 11:02 UTC

[Перевод] Объясняем векторные базы данных на трех уровнях сложности

Из этого материала вы узнаете о том, как работают векторные базы данных, разобравшись с широким диапазоном тем — от основ поиска по сходству, до стратегий индексирования, которые позволяют применять на практике крупномасштабный поиск данных.

https://habr.com/ru/companies/wunderfund/articles/1022820/

#векторные_базы_данных #HNSW #IFV

#ifv #hnsw #векторные_базы_данных

Habr @[email protected] · 2026-04-13 · 11:02 UTC

[Перевод] Объясняем векторные базы данных на трех уровнях сложности

Из этого материала вы узнаете о том, как работают векторные базы данных, разобравшись с широким диапазоном тем — от основ поиска по сходству, до стратегий индексирования, которые позволяют применять на практике крупномасштабный поиск данных.

https://habr.com/ru/companies/wunderfund/articles/1022820/

#векторные_базы_данных #HNSW #IFV

#ifv #hnsw #векторные_базы_данных

Habr @[email protected] · 2026-04-13 · 11:02 UTC

[Перевод] Объясняем векторные базы данных на трех уровнях сложности

Из этого материала вы узнаете о том, как работают векторные базы данных, разобравшись с широким диапазоном тем — от основ поиска по сходству, до стратегий индексирования, которые позволяют применять на практике крупномасштабный поиск данных.

https://habr.com/ru/companies/wunderfund/articles/1022820/

#векторные_базы_данных #HNSW #IFV

#ifv #hnsw #векторные_базы_данных

Habr @[email protected] · 2026-04-13 · 11:02 UTC

[Перевод] Объясняем векторные базы данных на трех уровнях сложности

Из этого материала вы узнаете о том, как работают векторные базы данных, разобравшись с широким диапазоном тем — от основ поиска по сходству, до стратегий индексирования, которые позволяют применять на практике крупномасштабный поиск данных.

https://habr.com/ru/companies/wunderfund/articles/1022820/

#векторные_базы_данных #HNSW #IFV

#векторные_базы_данных #hnsw #ifv

Habr @[email protected] · 2026-02-17 · 15:12 UTC

Как векторные базы данных налаживают взаимопонимание между человечеством и роботами

В 2026 году генеративные модели на основе искусственного интеллекта не всегда понимают, что просил пользователь, и выдают нерелевантные ответы. Векторные базы данных помогают ИИ распознавать смысл, который человек вкладывает в запрос, и быстрее находить нужную информацию. Если в вашем проекте пользователи ищут данные не по точным ключевым запросам, а по смыслу, эта статья для вас. В ней мы расскажем, как работают векторные базы данных, для каких проектов они нужны и как выбрать подходящую в зависимости от задач. О ВБД простыми словами →

https://habr.com/ru/companies/netologyru/articles/980814/

#векторные_базы_данных #базы_данных #векторные_пространства #векторы #семантический_поиск #эмбеддинги #llmмодели #ai #иимодель #ии

#ии #иимодель #ai #llmмодели #эмбеддинги #семантический_поиск

Habr @[email protected] · 2026-01-23 · 07:22 UTC

Почему ваш RAG не найдёт нужные документы: математический потолок embedding-моделей

Все говорят про embedding-модели в RAG: бенчмарки MTEB, размеры моделей, chunking-стратегии. Но никто не задаёт главный вопрос: а сколько вообще документов может найти single-vector retrieval? Google DeepMind посчитали. Оказалось, что даже 4096-мерные эмбеддинги упираются в математический потолок — есть задачи, где они физически не смогут найти нужный документ из топ-2, даже если модель идеально обучена. В статье разбирается исследование LIMIT, показаны примеры, где dense retrieval проваливается (а BM25 справляется), и объяснено, почему для production-систем нужен гибридный поиск, а не слепая вера в SOTA-эмбеддинги.

https://habr.com/ru/articles/987954/

#RAG #embedding #retrieval #machine_learning #BM25 #поиск #нейросети #векторные_базы_данных

#векторные_базы_данных #нейросети #поиск #bm25 #machine_learning #retrieval

Habr @[email protected] · 2026-01-23 · 07:22 UTC

Почему ваш RAG не найдёт нужные документы: математический потолок embedding-моделей

Все говорят про embedding-модели в RAG: бенчмарки MTEB, размеры моделей, chunking-стратегии. Но никто не задаёт главный вопрос: а сколько вообще документов может найти single-vector retrieval? Google DeepMind посчитали. Оказалось, что даже 4096-мерные эмбеддинги упираются в математический потолок — есть задачи, где они физически не смогут найти нужный документ из топ-2, даже если модель идеально обучена. В статье разбирается исследование LIMIT, показаны примеры, где dense retrieval проваливается (а BM25 справляется), и объяснено, почему для production-систем нужен гибридный поиск, а не слепая вера в SOTA-эмбеддинги.

https://habr.com/ru/articles/987954/

#RAG #embedding #retrieval #machine_learning #BM25 #поиск #нейросети #векторные_базы_данных

#векторные_базы_данных #нейросети #поиск #bm25 #machine_learning #retrieval

Habr @[email protected] · 2026-01-23 · 07:22 UTC

Почему ваш RAG не найдёт нужные документы: математический потолок embedding-моделей

Все говорят про embedding-модели в RAG: бенчмарки MTEB, размеры моделей, chunking-стратегии. Но никто не задаёт главный вопрос: а сколько вообще документов может найти single-vector retrieval? Google DeepMind посчитали. Оказалось, что даже 4096-мерные эмбеддинги упираются в математический потолок — есть задачи, где они физически не смогут найти нужный документ из топ-2, даже если модель идеально обучена. В статье разбирается исследование LIMIT, показаны примеры, где dense retrieval проваливается (а BM25 справляется), и объяснено, почему для production-систем нужен гибридный поиск, а не слепая вера в SOTA-эмбеддинги.

https://habr.com/ru/articles/987954/

#RAG #embedding #retrieval #machine_learning #BM25 #поиск #нейросети #векторные_базы_данных

#векторные_базы_данных #нейросети #поиск #bm25 #machine_learning #retrieval

Habr @[email protected] · 2026-01-23 · 07:22 UTC

Почему ваш RAG не найдёт нужные документы: математический потолок embedding-моделей

Все говорят про embedding-модели в RAG: бенчмарки MTEB, размеры моделей, chunking-стратегии. Но никто не задаёт главный вопрос: а сколько вообще документов может найти single-vector retrieval? Google DeepMind посчитали. Оказалось, что даже 4096-мерные эмбеддинги упираются в математический потолок — есть задачи, где они физически не смогут найти нужный документ из топ-2, даже если модель идеально обучена. В статье разбирается исследование LIMIT, показаны примеры, где dense retrieval проваливается (а BM25 справляется), и объяснено, почему для production-систем нужен гибридный поиск, а не слепая вера в SOTA-эмбеддинги.

https://habr.com/ru/articles/987954/

#RAG #embedding #retrieval #machine_learning #BM25 #поиск #нейросети #векторные_базы_данных

#rag #embedding #retrieval #machine_learning #bm25 #поиск

Habr @[email protected] · 2025-12-28 · 14:52 UTC

Нейропоисковик на 17 миллионов картинок: OpenCLIP, Qdrant и ZeroTier вместо облаков

Как сделать свой аналог Pinterest, если у вас нет бюджета корпорации, но есть 4 ТБ картинок (17 миллионов штук) и желание искать по ним не просто по тегам, а по визуальному стилю? В статье — опыт построения распределенной системы поиска из подручных средств. Разбираем архитектуру: — Гибридное хранение: Backblaze B2 (холодное) + Домашний сервер (вычисления). — Сеть: Как ZeroTier объединил разрозненные ноды в одну Mesh-сеть без белых IP. — Векторный поиск: Как уместить 17 миллионов векторов OpenCLIP ViT-H/14 в 32 ГБ RAM с помощью Qdrant и квантизации. — Оптимизация: Почему поиск работает за 5 мс, а загрузка метаданных тормозила до 3 секунд, и как PostgreSQL спас ситуацию. Полный разбор ETL-пайплайна и экономики домашнего HighLoad-проекта.

https://habr.com/ru/articles/981330/

#python #векторные_базы_данных #qdrant #поиск_изображений #clip #zerotier #оптимизация #petproject #diy #selfhosting

#selfhosting #diy #petproject #оптимизация #zerotier #clip

Habr @[email protected] · 2025-11-20 · 06:22 UTC

Путешествие в пространство смыслов: как анатомия LLM поможет нам в работе со смыслами и поиске новой теории познания

В старые времена путешествие из одной части мира в другую могло занимать целые месяцы, а иногда и годы. Представления людей об устройстве мира в то время были наполнены мифами о песиголовцах, единорогах и прочих небылицах. На белых пятнах географических карт их составители, не зная, что там находится, часто писали "тут проживают драконы". Сейчас же мы можем открыть точную карту планеты онлайн и за секунды простроить дорожный маршрут из одной точки мира в другую. Современные технологии дали нам удобный интерфейс взаимодействия с полной картой физического пространства нашей планеты. Точно такой же переворот прямо сейчас происходит с другим, уже нефизическим, пространством - миром идей и смыслов. Последние достижения в области машинного обучения, нейронных сетей и больших языковых моделей дали нам возможность составить точную карту пространства смыслов и продвигаться в нём уже не на ощупь, как прежде, а с широко открытыми глазами...

https://habr.com/ru/articles/962644/

#пространство_смыслов #llm #векторные_базы_данных #скорость_света #фракталы #информация #объектноориентированная_онтология

#пространство_смыслов #llm #векторные_базы_данных #скорость_света #фракталы #информация

Habr @[email protected] · 2025-11-20 · 06:22 UTC

Путешествие в пространство смыслов: как анатомия LLM поможет нам в работе со смыслами и поиске новой теории познания

В старые времена путешествие из одной части мира в другую могло занимать целые месяцы, а иногда и годы. Представления людей об устройстве мира в то время были наполнены мифами о песиголовцах, единорогах и прочих небылицах. На белых пятнах географических карт их составители, не зная, что там находится, часто писали "тут проживают драконы". Сейчас же мы можем открыть точную карту планеты онлайн и за секунды простроить дорожный маршрут из одной точки мира в другую. Современные технологии дали нам удобный интерфейс взаимодействия с полной картой физического пространства нашей планеты. Точно такой же переворот прямо сейчас происходит с другим, уже нефизическим, пространством - миром идей и смыслов. Последние достижения в области машинного обучения, нейронных сетей и больших языковых моделей дали нам возможность составить точную карту пространства смыслов и продвигаться в нём уже не на ощупь, как прежде, а с широко открытыми глазами...

https://habr.com/ru/articles/962644/

#пространство_смыслов #llm #векторные_базы_данных #скорость_света #фракталы #информация #объектноориентированная_онтология

#пространство_смыслов #llm #векторные_базы_данных #скорость_света #фракталы #информация

Habr @[email protected] · 2025-11-20 · 06:22 UTC

Путешествие в пространство смыслов: как анатомия LLM поможет нам в работе со смыслами и поиске новой теории познания

В старые времена путешествие из одной части мира в другую могло занимать целые месяцы, а иногда и годы. Представления людей об устройстве мира в то время были наполнены мифами о песиголовцах, единорогах и прочих небылицах. На белых пятнах географических карт их составители, не зная, что там находится, часто писали "тут проживают драконы". Сейчас же мы можем открыть точную карту планеты онлайн и за секунды простроить дорожный маршрут из одной точки мира в другую. Современные технологии дали нам удобный интерфейс взаимодействия с полной картой физического пространства нашей планеты. Точно такой же переворот прямо сейчас происходит с другим, уже нефизическим, пространством - миром идей и смыслов. Последние достижения в области машинного обучения, нейронных сетей и больших языковых моделей дали нам возможность составить точную карту пространства смыслов и продвигаться в нём уже не на ощупь, как прежде, а с широко открытыми глазами...

https://habr.com/ru/articles/962644/

#пространство_смыслов #llm #векторные_базы_данных #скорость_света #фракталы #информация #объектноориентированная_онтология

#пространство_смыслов #llm #векторные_базы_данных #скорость_света #фракталы #информация

Habr @[email protected] · 2025-10-08 · 08:22 UTC

Chonkie: революция в RAG-чанкинге — скорость, лёгкость, удобство

В эпоху, когда большие языковые модели (LLM) становятся всё более мощными и применяются во многих задачах, одна из ключевых проблем остаётся прежней — как эффективно снабжать их релевантным контекстом. Одним из популярных решений является подход RAG, где качество итогового ответа зависит от целого ряда факторов, одним из которых является качественное чанкирование исходных текстов. Сегодня мы рассмотрим одно из новых и интересных решений. Всем привет! Меня зовут Вадим, я Data Scientist в компании Raft. В этой статье я расскажу о Chonkie — библиотеке для простого и быстрого чанкирования документов, а также на практике применю её и сравню с другими популярными решениями: LangChain и LlamaIndex .

https://habr.com/ru/companies/raft/articles/954158/

#rag #chunking #ai #поиск #чанкинг #векторные_базы_данных #библиотека #llm_память

#llm_память #библиотека #векторные_базы_данных #чанкинг #поиск #ai

Habr @[email protected] · 2025-10-08 · 08:22 UTC

Chonkie: революция в RAG-чанкинге — скорость, лёгкость, удобство

В эпоху, когда большие языковые модели (LLM) становятся всё более мощными и применяются во многих задачах, одна из ключевых проблем остаётся прежней — как эффективно снабжать их релевантным контекстом. Одним из популярных решений является подход RAG, где качество итогового ответа зависит от целого ряда факторов, одним из которых является качественное чанкирование исходных текстов. Сегодня мы рассмотрим одно из новых и интересных решений. Всем привет! Меня зовут Вадим, я Data Scientist в компании Raft. В этой статье я расскажу о Chonkie — библиотеке для простого и быстрого чанкирования документов, а также на практике применю её и сравню с другими популярными решениями: LangChain и LlamaIndex .

https://habr.com/ru/companies/raft/articles/954158/

#rag #chunking #ai #поиск #чанкинг #векторные_базы_данных #библиотека #llm_память

#llm_память #библиотека #векторные_базы_данных #чанкинг #поиск #ai

Habr @[email protected] · 2025-10-08 · 08:22 UTC

Chonkie: революция в RAG-чанкинге — скорость, лёгкость, удобство

В эпоху, когда большие языковые модели (LLM) становятся всё более мощными и применяются во многих задачах, одна из ключевых проблем остаётся прежней — как эффективно снабжать их релевантным контекстом. Одним из популярных решений является подход RAG, где качество итогового ответа зависит от целого ряда факторов, одним из которых является качественное чанкирование исходных текстов. Сегодня мы рассмотрим одно из новых и интересных решений. Всем привет! Меня зовут Вадим, я Data Scientist в компании Raft. В этой статье я расскажу о Chonkie — библиотеке для простого и быстрого чанкирования документов, а также на практике применю её и сравню с другими популярными решениями: LangChain и LlamaIndex .

https://habr.com/ru/companies/raft/articles/954158/

#rag #chunking #ai #поиск #чанкинг #векторные_базы_данных #библиотека #llm_память

#llm_память #библиотека #векторные_базы_данных #чанкинг #поиск #ai

Habr @[email protected] · 2025-10-08 · 08:22 UTC

Chonkie: революция в RAG-чанкинге — скорость, лёгкость, удобство

В эпоху, когда большие языковые модели (LLM) становятся всё более мощными и применяются во многих задачах, одна из ключевых проблем остаётся прежней — как эффективно снабжать их релевантным контекстом. Одним из популярных решений является подход RAG, где качество итогового ответа зависит от целого ряда факторов, одним из которых является качественное чанкирование исходных текстов. Сегодня мы рассмотрим одно из новых и интересных решений. Всем привет! Меня зовут Вадим, я Data Scientist в компании Raft. В этой статье я расскажу о Chonkie — библиотеке для простого и быстрого чанкирования документов, а также на практике применю её и сравню с другими популярными решениями: LangChain и LlamaIndex .

https://habr.com/ru/companies/raft/articles/954158/

#rag #chunking #ai #поиск #чанкинг #векторные_базы_данных #библиотека #llm_память

#rag #chunking #ai #поиск #чанкинг #векторные_базы_данных

Habr @[email protected] · 2025-09-12 · 15:02 UTC

Law & Practice Ensemble RAG. Как создать ИИ-ассистента, помогающего решать многоаспектные юридические задачи

В первой части мы кратко рассмотрели предпосылки и последствия ИИ‑трансформации деятельности юристов, а также предложили вариант архитектуры продвинутой RAG‑системы, учитывающей особенности юридической предметной области. Во этой части мы проведем обзор общих и юридических бенчмарков, которые целесообразно учитывать при оценке технических компонент RAG, а также системы в целом. В заключение рассмотрим, как самостоятельно подготовить тестовый датасет для оценки RAG‑системы с помощью фреймворка RAGAS и разберем итоговые результаты эксперимента.

https://habr.com/ru/companies/otus/articles/946354/

#RAG #retrievalaugmented_generation #LLM #Large_Language_Models #Эмбеддинги #Векторные_базы_данных #Векторные_хранилища #Индексация #Ранжирование

#rag #retrievalaugmented_generation #llm #large_language_models #эмбеддинги #векторные_базы_данных

Habr @[email protected] · 2025-09-12 · 15:02 UTC

Law & Practice Ensemble RAG. Как создать ИИ-ассистента, помогающего решать многоаспектные юридические задачи

В первой части мы кратко рассмотрели предпосылки и последствия ИИ‑трансформации деятельности юристов, а также предложили вариант архитектуры продвинутой RAG‑системы, учитывающей особенности юридической предметной области. Во этой части мы проведем обзор общих и юридических бенчмарков, которые целесообразно учитывать при оценке технических компонент RAG, а также системы в целом. В заключение рассмотрим, как самостоятельно подготовить тестовый датасет для оценки RAG‑системы с помощью фреймворка RAGAS и разберем итоговые результаты эксперимента.

https://habr.com/ru/companies/otus/articles/946354/

#RAG #retrievalaugmented_generation #LLM #Large_Language_Models #Эмбеддинги #Векторные_базы_данных #Векторные_хранилища #Индексация #Ранжирование

#rag #retrievalaugmented_generation #llm #large_language_models #эмбеддинги #векторные_базы_данных

Habr @[email protected] · 2025-09-12 · 15:02 UTC

Law & Practice Ensemble RAG. Как создать ИИ-ассистента, помогающего решать многоаспектные юридические задачи

В первой части мы кратко рассмотрели предпосылки и последствия ИИ‑трансформации деятельности юристов, а также предложили вариант архитектуры продвинутой RAG‑системы, учитывающей особенности юридической предметной области. Во этой части мы проведем обзор общих и юридических бенчмарков, которые целесообразно учитывать при оценке технических компонент RAG, а также системы в целом. В заключение рассмотрим, как самостоятельно подготовить тестовый датасет для оценки RAG‑системы с помощью фреймворка RAGAS и разберем итоговые результаты эксперимента.

https://habr.com/ru/companies/otus/articles/946354/

#RAG #retrievalaugmented_generation #LLM #Large_Language_Models #Эмбеддинги #Векторные_базы_данных #Векторные_хранилища #Индексация #Ранжирование

#rag #retrievalaugmented_generation #llm #large_language_models #эмбеддинги #векторные_базы_данных

Habr @[email protected] · 2025-09-12 · 15:02 UTC

Law & Practice Ensemble RAG. Как создать ИИ-ассистента, помогающего решать многоаспектные юридические задачи

В первой части мы кратко рассмотрели предпосылки и последствия ИИ‑трансформации деятельности юристов, а также предложили вариант архитектуры продвинутой RAG‑системы, учитывающей особенности юридической предметной области. Во этой части мы проведем обзор общих и юридических бенчмарков, которые целесообразно учитывать при оценке технических компонент RAG, а также системы в целом. В заключение рассмотрим, как самостоятельно подготовить тестовый датасет для оценки RAG‑системы с помощью фреймворка RAGAS и разберем итоговые результаты эксперимента.

https://habr.com/ru/companies/otus/articles/946354/

#RAG #retrievalaugmented_generation #LLM #Large_Language_Models #Эмбеддинги #Векторные_базы_данных #Векторные_хранилища #Индексация #Ранжирование

#ранжирование #индексация #векторные_хранилища #векторные_базы_данных #эмбеддинги #large_language_models

Habr @[email protected] · 2025-04-06 · 09:02 UTC

Личный ИИ-ассистент на ваших данных. Часть 1: Векторная база ChromaDB + DeepSeek | GPT

Сегодня поговорим о теме, которая вызывает живой интерес у многих разработчиков и энтузиастов ИИ — интеграции больших языковых моделей вроде DeepSeek или ChatGPT с собственной базой знаний. В этой статье я подробно расскажу, как работают векторные базы данных, зачем они нужны и какую роль играют в построении эффективной связки между вашей внутренней информацией и мощью современных LLM. Если вы хотите научиться «обучать» ИИ на своих данных — добро пожаловать!

https://habr.com/ru/companies/amvera/articles/897830/

#python #deepseek #chatgpt #cromadb #векторные_базы_данных #rag #openai_api #langchain #база_знаний_поиск #chromadb_install

#python #deepseek #chatgpt #cromadb #векторные_базы_данных #rag

Habr @[email protected] · 2024-04-15 · 22:22 UTC

Векторные БД vs Точность — часть 1

Как я пытался собрать "по-быстрому" локальный RAG(retrieval augmentation generation), который будет находить термины из словаря Ожегова и поделиться об этом тут. На просторах интернетах все просто. Но на практике для моей задачи это оказалось не так. Точность...

https://habr.com/ru/articles/807957/

#llm #векторные_базы_данных #retrieval_augmented_generation #chromadb

#chromadb #retrieval_augmented_generation #векторные_базы_данных #llm

Habr @[email protected] · 2025-06-18 · 16:32 UTC

Как мы внедрили векторный поиск в Postgres Pro

В статье разберемся, что такое векторный поиск, какие проблемы он решает, и как расширение pgpro_vector для Postgres Pro позволяет реализовать эти мощные возможности прямо в реляционной базе данных, без необходимости развертывать отдельные специализированные системы.

https://habr.com/ru/companies/postgrespro/articles/919552/

#векторизация #вектор #векторные_базы_данных #векторный_поиск #postgres #postgres_pro #разработка_баз_данных #администрирование_баз_данных

#векторизация #вектор #векторные_базы_данных #векторный_поиск #postgres #postgres_pro

Habr @[email protected] · 2024-05-26 · 12:42 UTC

Векторные БД vs Точность — часть 2

В первой части из тестов стало понятно, что в векторном поиске с терминами что-то не так. И точность достаточно низкая для корректной работы RAG (retrieval augmentation generation). Давайте попробуем гибридный поиск и посмотрим, что из этого получится.

https://habr.com/ru/articles/817173/

#llm #векторные_базы_данных #retrieval_augmented_generation #chroma #weaviate #qdrant

#qdrant #weaviate #chroma #retrieval_augmented_generation #векторные_базы_данных #llm

Habr @[email protected] · 2025-08-25 · 09:22 UTC

Строим корпоративную GenAI-платформу: от концепции до ROI. Часть 3. Retrieval-Augmented Generation (RAG) на службе GenAI

Это третья статья специалиста по архитектуре ИТ-систем и трансформации ИТ-ландшафта Дениса Прилепского из серии «Строим корпоративную GenAI-платформу: от концепции до ROI». Автор разбирает, что такое RAG и зачем он нужен, как устроена архитектура retrieval-уровня и почему он критически важен для достоверных ответов. В статье — пример генерации юридической справки, практические проблемы (задержки, кеширование, актуальность) и подготовка к следующей теме — guardrails.

https://habr.com/ru/companies/mipt_digital/articles/932962/

#RAG #retrieval #векторные_базы_данных #эмбеддинги #LLM #корпоративные_ассистенты #кеширование #генерация_с_контекстом

#генерация_с_контекстом #кеширование #корпоративные_ассистенты #llm #эмбеддинги #векторные_базы_данных

Habr @[email protected] · 2025-04-22 · 05:52 UTC

Личный ИИ-ассистент на ваших данных. Часть 2: Веб-интерфейс, авторизация и стриминг ответов от ИИ

Продолжаем тему, которая вызывает живой интерес у многих разработчиков и энтузиастов ИИ — создание собственного ассистента на базе ChatGPT или DeepSeek с использованием личной базы знаний. В этой части статьи мы шаг за шагом превращаем консольную заготовку из первой части в полноценный веб-сервис: — реализуем авторизацию — создаём веб-чат с выбором нейросети — интегрируем всё через FastAPI — готовим к деплою Если вы хотите, чтобы ваш ИИ-ассистент выглядел и работал как настоящий сервис — поехали!

https://habr.com/ru/companies/amvera/articles/902868/

#векторные_базы_данных #python #deepseek #chatgpt #langchain #openapi #openapi_api #fastapi #fastapi_stream #jinja2

#векторные_базы_данных #python #deepseek #chatgpt #langchain #openapi

Habr @[email protected] · 2025-06-15 · 09:42 UTC

Новые векторные СУБД и другие инструменты для МО

Ранее в блоге

https://habr.com/ru/companies/beeline_cloud/articles/918480/

#beeline_cloud #векторные_базы_данных #векторизация #векторные_представления #rag

Habr @[email protected] · 2025-06-16 · 14:12 UTC

BlackWave: Как я создал симулятор соцсети с тысячами ИИ-ботов и почему перешёл на Python

Эта статья — не просто рассказ о разработке. Это путь от сумасшедшей идеи «социальной сети для одного» до полноценной open-source платформы, где каждый бот — личность. Я поделюсь тем, как строил архитектуру, зачем отказался от C# в пользу Python и почему важно, чтобы ИИ-боты вели себя не как алгоритмы, а как настоящие люди. Читать

https://habr.com/ru/articles/918848/

#Python #Django #fastapi #искусственный_интеллект #социальные_сети #открытый_код #docker #dockercompose #ai #векторные_базы_данных

#python #django #fastapi #искусственный_интеллект #социальные_сети #открытый_код

Habr @[email protected] · 2024-12-06 · 14:32 UTC

[Перевод] О векторных базах данных простым языком

Представьте, что управляете онлайн-магазином, предлагающим тысячи товаров. Чтобы помочь пользователям находить нужные позиции, вы добавили строку поиска. Теперь посетители могут вводить интересующие их запросы, на что вы будете показывать им подходящие результаты. Например, когда пользователь вводит «лето», вы можете показывать предметы вроде шортов, платьев, панам и пляжных зонтов. Как бы вы реализовали такую систему?

https://habr.com/ru/companies/ruvds/articles/863704/

#ruvds_переводы #векторные_базы_данных #postgres #mysql #python #машинное_обучение #алгоритмы #онлайнторговля

#онлайнторговля #алгоритмы #машинное_обучение #python #mysql #postgres

Habr @[email protected] · 2025-06-18 · 16:32 UTC

Как мы внедрили векторный поиск в Postgres Pro

В статье разберемся, что такое векторный поиск, какие проблемы он решает, и как расширение pgpro_vector для Postgres Pro позволяет реализовать эти мощные возможности прямо в реляционной базе данных, без необходимости развертывать отдельные специализированные системы.

https://habr.com/ru/companies/postgrespro/articles/919552/

#векторизация #вектор #векторные_базы_данных #векторный_поиск #postgres #postgres_pro #разработка_баз_данных #администрирование_баз_данных

#векторизация #вектор #векторные_базы_данных #векторный_поиск #postgres #postgres_pro

Habr @[email protected] · 2025-06-18 · 16:32 UTC

Как мы внедрили векторный поиск в Postgres Pro

В статье разберемся, что такое векторный поиск, какие проблемы он решает, и как расширение pgpro_vector для Postgres Pro позволяет реализовать эти мощные возможности прямо в реляционной базе данных, без необходимости развертывать отдельные специализированные системы.

https://habr.com/ru/companies/postgrespro/articles/919552/

#векторизация #вектор #векторные_базы_данных #векторный_поиск #postgres #postgres_pro #разработка_баз_данных #администрирование_баз_данных

#векторизация #вектор #векторные_базы_данных #векторный_поиск #postgres #postgres_pro

Habr @[email protected] · 2025-06-18 · 16:32 UTC

Как мы внедрили векторный поиск в Postgres Pro

В статье разберемся, что такое векторный поиск, какие проблемы он решает, и как расширение pgpro_vector для Postgres Pro позволяет реализовать эти мощные возможности прямо в реляционной базе данных, без необходимости развертывать отдельные специализированные системы.

https://habr.com/ru/companies/postgrespro/articles/919552/

#векторизация #вектор #векторные_базы_данных #векторный_поиск #postgres #postgres_pro #разработка_баз_данных #администрирование_баз_данных

#администрирование_баз_данных #разработка_баз_данных #postgres_pro #postgres #векторный_поиск #векторные_базы_данных

Habr @[email protected] · 2025-04-22 · 05:52 UTC

Личный ИИ-ассистент на ваших данных. Часть 2: Веб-интерфейс, авторизация и стриминг ответов от ИИ

Продолжаем тему, которая вызывает живой интерес у многих разработчиков и энтузиастов ИИ — создание собственного ассистента на базе ChatGPT или DeepSeek с использованием личной базы знаний. В этой части статьи мы шаг за шагом превращаем консольную заготовку из первой части в полноценный веб-сервис: — реализуем авторизацию — создаём веб-чат с выбором нейросети — интегрируем всё через FastAPI — готовим к деплою Если вы хотите, чтобы ваш ИИ-ассистент выглядел и работал как настоящий сервис — поехали!

https://habr.com/ru/companies/amvera/articles/902868/

#векторные_базы_данных #python #deepseek #chatgpt #langchain #openapi #openapi_api #fastapi #fastapi_stream #jinja2

#векторные_базы_данных #python #deepseek #chatgpt #langchain #openapi

Habr @[email protected] · 2025-04-22 · 05:52 UTC

Личный ИИ-ассистент на ваших данных. Часть 2: Веб-интерфейс, авторизация и стриминг ответов от ИИ

Продолжаем тему, которая вызывает живой интерес у многих разработчиков и энтузиастов ИИ — создание собственного ассистента на базе ChatGPT или DeepSeek с использованием личной базы знаний. В этой части статьи мы шаг за шагом превращаем консольную заготовку из первой части в полноценный веб-сервис: — реализуем авторизацию — создаём веб-чат с выбором нейросети — интегрируем всё через FastAPI — готовим к деплою Если вы хотите, чтобы ваш ИИ-ассистент выглядел и работал как настоящий сервис — поехали!

https://habr.com/ru/companies/amvera/articles/902868/

#векторные_базы_данных #python #deepseek #chatgpt #langchain #openapi #openapi_api #fastapi #fastapi_stream #jinja2

#векторные_базы_данных #python #deepseek #chatgpt #langchain #openapi

Habr @[email protected] · 2025-04-22 · 05:52 UTC

Личный ИИ-ассистент на ваших данных. Часть 2: Веб-интерфейс, авторизация и стриминг ответов от ИИ

Продолжаем тему, которая вызывает живой интерес у многих разработчиков и энтузиастов ИИ — создание собственного ассистента на базе ChatGPT или DeepSeek с использованием личной базы знаний. В этой части статьи мы шаг за шагом превращаем консольную заготовку из первой части в полноценный веб-сервис: — реализуем авторизацию — создаём веб-чат с выбором нейросети — интегрируем всё через FastAPI — готовим к деплою Если вы хотите, чтобы ваш ИИ-ассистент выглядел и работал как настоящий сервис — поехали!

https://habr.com/ru/companies/amvera/articles/902868/

#векторные_базы_данных #python #deepseek #chatgpt #langchain #openapi #openapi_api #fastapi #fastapi_stream #jinja2

#jinja2 #fastapi_stream #fastapi #openapi_api #openapi #langchain