home.social

#векторные_базы_данных — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #векторные_базы_данных, aggregated by home.social.

  1. [Перевод] Пять документов ломают ваш RAG: где реальная уязвимость и что с ней делать

    RAG часто воспринимают как аккуратный способ «заземлить» LLM на документах и снизить риск галлюцинаций. Но у этой архитектуры есть менее очевидная проблема: контекст из базы знаний обычно считается доверенным, хотя именно через него в модель могут попасть вредоносные инструкции. В статье разбираем, как несколько отравленных документов могут повлиять на ответы системы, почему эмбеддинги нельзя считать безопасной абстракцией и какие уровни защиты нужны, если RAG используется не в демо, а в реальном продакшене. К рискам RAG

    habr.com/ru/companies/otus/art

    #RAG #LLM #промптинъекции #безопасность_llm #отравление_данных #векторные_базы_данных #эмбеддинги #OWASP_LLM_Top_10

  2. [Перевод] Практическое руководство по инжинирингу контекста для AI-ассистентов

    Каждая новая сессия с AI-ассистентом для разработки обнуляет накопленный контекст: инструменты мощные, но по своей природе «забывчивые». В итоге мы снова и снова проговариваем стек, соглашения и ограничения, тратя время на восстановление того, что уже было известно вчера. В статье разберемся, как превратить это слабое место в управляемый ресурс: от простых файлов правил до полноценных слоёв памяти и инфраструктуры, которые позволяют ассистенту работать с учётом накопленного опыта.

    habr.com/ru/companies/otus/art

    #LLM #инжиниринг_контекста #память_AI #контекстное_окно #rag #промптинжиниринг #LLMинженер #векторные_базы_данных #AIассистенты

  3. [Перевод] Практическое руководство по инжинирингу контекста для AI-ассистентов

    Каждая новая сессия с AI-ассистентом для разработки обнуляет накопленный контекст: инструменты мощные, но по своей природе «забывчивые». В итоге мы снова и снова проговариваем стек, соглашения и ограничения, тратя время на восстановление того, что уже было известно вчера. В статье разберемся, как превратить это слабое место в управляемый ресурс: от простых файлов правил до полноценных слоёв памяти и инфраструктуры, которые позволяют ассистенту работать с учётом накопленного опыта.

    habr.com/ru/companies/otus/art

    #LLM #инжиниринг_контекста #память_AI #контекстное_окно #rag #промптинжиниринг #LLMинженер #векторные_базы_данных #AIассистенты

  4. [Перевод] Практическое руководство по инжинирингу контекста для AI-ассистентов

    Каждая новая сессия с AI-ассистентом для разработки обнуляет накопленный контекст: инструменты мощные, но по своей природе «забывчивые». В итоге мы снова и снова проговариваем стек, соглашения и ограничения, тратя время на восстановление того, что уже было известно вчера. В статье разберемся, как превратить это слабое место в управляемый ресурс: от простых файлов правил до полноценных слоёв памяти и инфраструктуры, которые позволяют ассистенту работать с учётом накопленного опыта.

    habr.com/ru/companies/otus/art

    #LLM #инжиниринг_контекста #память_AI #контекстное_окно #rag #промптинжиниринг #LLMинженер #векторные_базы_данных #AIассистенты

  5. [Перевод] Практическое руководство по инжинирингу контекста для AI-ассистентов

    Каждая новая сессия с AI-ассистентом для разработки обнуляет накопленный контекст: инструменты мощные, но по своей природе «забывчивые». В итоге мы снова и снова проговариваем стек, соглашения и ограничения, тратя время на восстановление того, что уже было известно вчера. В статье разберемся, как превратить это слабое место в управляемый ресурс: от простых файлов правил до полноценных слоёв памяти и инфраструктуры, которые позволяют ассистенту работать с учётом накопленного опыта.

    habr.com/ru/companies/otus/art

    #LLM #инжиниринг_контекста #память_AI #контекстное_окно #rag #промптинжиниринг #LLMинженер #векторные_базы_данных #AIассистенты

  6. [Перевод] Объясняем векторные базы данных на трех уровнях сложности

    Из этого материала вы узнаете о том, как работают векторные базы данных, разобравшись с широким диапазоном тем — от основ поиска по сходству, до стратегий индексирования, которые позволяют применять на практике крупномасштабный поиск данных.

    habr.com/ru/companies/wunderfu

    #векторные_базы_данных #HNSW #IFV

  7. [Перевод] Объясняем векторные базы данных на трех уровнях сложности

    Из этого материала вы узнаете о том, как работают векторные базы данных, разобравшись с широким диапазоном тем — от основ поиска по сходству, до стратегий индексирования, которые позволяют применять на практике крупномасштабный поиск данных.

    habr.com/ru/companies/wunderfu

    #векторные_базы_данных #HNSW #IFV

  8. [Перевод] Объясняем векторные базы данных на трех уровнях сложности

    Из этого материала вы узнаете о том, как работают векторные базы данных, разобравшись с широким диапазоном тем — от основ поиска по сходству, до стратегий индексирования, которые позволяют применять на практике крупномасштабный поиск данных.

    habr.com/ru/companies/wunderfu

    #векторные_базы_данных #HNSW #IFV

  9. [Перевод] Объясняем векторные базы данных на трех уровнях сложности

    Из этого материала вы узнаете о том, как работают векторные базы данных, разобравшись с широким диапазоном тем — от основ поиска по сходству, до стратегий индексирования, которые позволяют применять на практике крупномасштабный поиск данных.

    habr.com/ru/companies/wunderfu

    #векторные_базы_данных #HNSW #IFV

  10. Как векторные базы данных налаживают взаимопонимание между человечеством и роботами

    В 2026 году генеративные модели на основе искусственного интеллекта не всегда понимают, что просил пользователь, и выдают нерелевантные ответы. Векторные базы данных помогают ИИ распознавать смысл, который человек вкладывает в запрос, и быстрее находить нужную информацию. Если в вашем проекте пользователи ищут данные не по точным ключевым запросам, а по смыслу, эта статья для вас. В ней мы расскажем, как работают векторные базы данных, для каких проектов они нужны и как выбрать подходящую в зависимости от задач. О ВБД простыми словами →

    habr.com/ru/companies/netology

    #векторные_базы_данных #базы_данных #векторные_пространства #векторы #семантический_поиск #эмбеддинги #llmмодели #ai #иимодель #ии

  11. Почему ваш RAG не найдёт нужные документы: математический потолок embedding-моделей

    Все говорят про embedding-модели в RAG: бенчмарки MTEB, размеры моделей, chunking-стратегии. Но никто не задаёт главный вопрос: а сколько вообще документов может найти single-vector retrieval? Google DeepMind посчитали. Оказалось, что даже 4096-мерные эмбеддинги упираются в математический потолок — есть задачи, где они физически не смогут найти нужный документ из топ-2, даже если модель идеально обучена. В статье разбирается исследование LIMIT, показаны примеры, где dense retrieval проваливается (а BM25 справляется), и объяснено, почему для production-систем нужен гибридный поиск, а не слепая вера в SOTA-эмбеддинги.

    habr.com/ru/articles/987954/

    #RAG #embedding #retrieval #machine_learning #BM25 #поиск #нейросети #векторные_базы_данных

  12. Почему ваш RAG не найдёт нужные документы: математический потолок embedding-моделей

    Все говорят про embedding-модели в RAG: бенчмарки MTEB, размеры моделей, chunking-стратегии. Но никто не задаёт главный вопрос: а сколько вообще документов может найти single-vector retrieval? Google DeepMind посчитали. Оказалось, что даже 4096-мерные эмбеддинги упираются в математический потолок — есть задачи, где они физически не смогут найти нужный документ из топ-2, даже если модель идеально обучена. В статье разбирается исследование LIMIT, показаны примеры, где dense retrieval проваливается (а BM25 справляется), и объяснено, почему для production-систем нужен гибридный поиск, а не слепая вера в SOTA-эмбеддинги.

    habr.com/ru/articles/987954/

    #RAG #embedding #retrieval #machine_learning #BM25 #поиск #нейросети #векторные_базы_данных

  13. Почему ваш RAG не найдёт нужные документы: математический потолок embedding-моделей

    Все говорят про embedding-модели в RAG: бенчмарки MTEB, размеры моделей, chunking-стратегии. Но никто не задаёт главный вопрос: а сколько вообще документов может найти single-vector retrieval? Google DeepMind посчитали. Оказалось, что даже 4096-мерные эмбеддинги упираются в математический потолок — есть задачи, где они физически не смогут найти нужный документ из топ-2, даже если модель идеально обучена. В статье разбирается исследование LIMIT, показаны примеры, где dense retrieval проваливается (а BM25 справляется), и объяснено, почему для production-систем нужен гибридный поиск, а не слепая вера в SOTA-эмбеддинги.

    habr.com/ru/articles/987954/

    #RAG #embedding #retrieval #machine_learning #BM25 #поиск #нейросети #векторные_базы_данных

  14. Почему ваш RAG не найдёт нужные документы: математический потолок embedding-моделей

    Все говорят про embedding-модели в RAG: бенчмарки MTEB, размеры моделей, chunking-стратегии. Но никто не задаёт главный вопрос: а сколько вообще документов может найти single-vector retrieval? Google DeepMind посчитали. Оказалось, что даже 4096-мерные эмбеддинги упираются в математический потолок — есть задачи, где они физически не смогут найти нужный документ из топ-2, даже если модель идеально обучена. В статье разбирается исследование LIMIT, показаны примеры, где dense retrieval проваливается (а BM25 справляется), и объяснено, почему для production-систем нужен гибридный поиск, а не слепая вера в SOTA-эмбеддинги.

    habr.com/ru/articles/987954/

    #RAG #embedding #retrieval #machine_learning #BM25 #поиск #нейросети #векторные_базы_данных

  15. Нейропоисковик на 17 миллионов картинок: OpenCLIP, Qdrant и ZeroTier вместо облаков

    Как сделать свой аналог Pinterest, если у вас нет бюджета корпорации, но есть 4 ТБ картинок (17 миллионов штук) и желание искать по ним не просто по тегам, а по визуальному стилю? В статье — опыт построения распределенной системы поиска из подручных средств. Разбираем архитектуру: — Гибридное хранение: Backblaze B2 (холодное) + Домашний сервер (вычисления). — Сеть: Как ZeroTier объединил разрозненные ноды в одну Mesh-сеть без белых IP. — Векторный поиск: Как уместить 17 миллионов векторов OpenCLIP ViT-H/14 в 32 ГБ RAM с помощью Qdrant и квантизации. — Оптимизация: Почему поиск работает за 5 мс, а загрузка метаданных тормозила до 3 секунд, и как PostgreSQL спас ситуацию. Полный разбор ETL-пайплайна и экономики домашнего HighLoad-проекта.

    habr.com/ru/articles/981330/

    #python #векторные_базы_данных #qdrant #поиск_изображений #clip #zerotier #оптимизация #petproject #diy #selfhosting

  16. Путешествие в пространство смыслов: как анатомия LLM поможет нам в работе со смыслами и поиске новой теории познания

    В старые времена путешествие из одной части мира в другую могло занимать целые месяцы, а иногда и годы. Представления людей об устройстве мира в то время были наполнены мифами о песиголовцах, единорогах и прочих небылицах. На белых пятнах географических карт их составители, не зная, что там находится, часто писали "тут проживают драконы". Сейчас же мы можем открыть точную карту планеты онлайн и за секунды простроить дорожный маршрут из одной точки мира в другую. Современные технологии дали нам удобный интерфейс взаимодействия с полной картой физического пространства нашей планеты. Точно такой же переворот прямо сейчас происходит с другим, уже нефизическим, пространством - миром идей и смыслов. Последние достижения в области машинного обучения, нейронных сетей и больших языковых моделей дали нам возможность составить точную карту пространства смыслов и продвигаться в нём уже не на ощупь, как прежде, а с широко открытыми глазами...

    habr.com/ru/articles/962644/

    #пространство_смыслов #llm #векторные_базы_данных #скорость_света #фракталы #информация #объектноориентированная_онтология

  17. Путешествие в пространство смыслов: как анатомия LLM поможет нам в работе со смыслами и поиске новой теории познания

    В старые времена путешествие из одной части мира в другую могло занимать целые месяцы, а иногда и годы. Представления людей об устройстве мира в то время были наполнены мифами о песиголовцах, единорогах и прочих небылицах. На белых пятнах географических карт их составители, не зная, что там находится, часто писали "тут проживают драконы". Сейчас же мы можем открыть точную карту планеты онлайн и за секунды простроить дорожный маршрут из одной точки мира в другую. Современные технологии дали нам удобный интерфейс взаимодействия с полной картой физического пространства нашей планеты. Точно такой же переворот прямо сейчас происходит с другим, уже нефизическим, пространством - миром идей и смыслов. Последние достижения в области машинного обучения, нейронных сетей и больших языковых моделей дали нам возможность составить точную карту пространства смыслов и продвигаться в нём уже не на ощупь, как прежде, а с широко открытыми глазами...

    habr.com/ru/articles/962644/

    #пространство_смыслов #llm #векторные_базы_данных #скорость_света #фракталы #информация #объектноориентированная_онтология

  18. Путешествие в пространство смыслов: как анатомия LLM поможет нам в работе со смыслами и поиске новой теории познания

    В старые времена путешествие из одной части мира в другую могло занимать целые месяцы, а иногда и годы. Представления людей об устройстве мира в то время были наполнены мифами о песиголовцах, единорогах и прочих небылицах. На белых пятнах географических карт их составители, не зная, что там находится, часто писали "тут проживают драконы". Сейчас же мы можем открыть точную карту планеты онлайн и за секунды простроить дорожный маршрут из одной точки мира в другую. Современные технологии дали нам удобный интерфейс взаимодействия с полной картой физического пространства нашей планеты. Точно такой же переворот прямо сейчас происходит с другим, уже нефизическим, пространством - миром идей и смыслов. Последние достижения в области машинного обучения, нейронных сетей и больших языковых моделей дали нам возможность составить точную карту пространства смыслов и продвигаться в нём уже не на ощупь, как прежде, а с широко открытыми глазами...

    habr.com/ru/articles/962644/

    #пространство_смыслов #llm #векторные_базы_данных #скорость_света #фракталы #информация #объектноориентированная_онтология

  19. Chonkie: революция в RAG-чанкинге — скорость, лёгкость, удобство

    В эпоху, когда большие языковые модели (LLM) становятся всё более мощными и применяются во многих задачах, одна из ключевых проблем остаётся прежней — как эффективно снабжать их релевантным контекстом. Одним из популярных решений является подход RAG, где качество итогового ответа зависит от целого ряда факторов, одним из которых является качественное чанкирование исходных текстов. Сегодня мы рассмотрим одно из новых и интересных решений. Всем привет! Меня зовут Вадим, я Data Scientist в компании Raft. В этой статье я расскажу о Chonkie — библиотеке для простого и быстрого чанкирования документов, а также на практике применю её и сравню с другими популярными решениями: LangChain и LlamaIndex .

    habr.com/ru/companies/raft/art

    #rag #chunking #ai #поиск #чанкинг #векторные_базы_данных #библиотека #llm_память

  20. Chonkie: революция в RAG-чанкинге — скорость, лёгкость, удобство

    В эпоху, когда большие языковые модели (LLM) становятся всё более мощными и применяются во многих задачах, одна из ключевых проблем остаётся прежней — как эффективно снабжать их релевантным контекстом. Одним из популярных решений является подход RAG, где качество итогового ответа зависит от целого ряда факторов, одним из которых является качественное чанкирование исходных текстов. Сегодня мы рассмотрим одно из новых и интересных решений. Всем привет! Меня зовут Вадим, я Data Scientist в компании Raft. В этой статье я расскажу о Chonkie — библиотеке для простого и быстрого чанкирования документов, а также на практике применю её и сравню с другими популярными решениями: LangChain и LlamaIndex .

    habr.com/ru/companies/raft/art

    #rag #chunking #ai #поиск #чанкинг #векторные_базы_данных #библиотека #llm_память

  21. Chonkie: революция в RAG-чанкинге — скорость, лёгкость, удобство

    В эпоху, когда большие языковые модели (LLM) становятся всё более мощными и применяются во многих задачах, одна из ключевых проблем остаётся прежней — как эффективно снабжать их релевантным контекстом. Одним из популярных решений является подход RAG, где качество итогового ответа зависит от целого ряда факторов, одним из которых является качественное чанкирование исходных текстов. Сегодня мы рассмотрим одно из новых и интересных решений. Всем привет! Меня зовут Вадим, я Data Scientist в компании Raft. В этой статье я расскажу о Chonkie — библиотеке для простого и быстрого чанкирования документов, а также на практике применю её и сравню с другими популярными решениями: LangChain и LlamaIndex .

    habr.com/ru/companies/raft/art

    #rag #chunking #ai #поиск #чанкинг #векторные_базы_данных #библиотека #llm_память

  22. Chonkie: революция в RAG-чанкинге — скорость, лёгкость, удобство

    В эпоху, когда большие языковые модели (LLM) становятся всё более мощными и применяются во многих задачах, одна из ключевых проблем остаётся прежней — как эффективно снабжать их релевантным контекстом. Одним из популярных решений является подход RAG, где качество итогового ответа зависит от целого ряда факторов, одним из которых является качественное чанкирование исходных текстов. Сегодня мы рассмотрим одно из новых и интересных решений. Всем привет! Меня зовут Вадим, я Data Scientist в компании Raft. В этой статье я расскажу о Chonkie — библиотеке для простого и быстрого чанкирования документов, а также на практике применю её и сравню с другими популярными решениями: LangChain и LlamaIndex .

    habr.com/ru/companies/raft/art

    #rag #chunking #ai #поиск #чанкинг #векторные_базы_данных #библиотека #llm_память

  23. Law & Practice Ensemble RAG. Как создать ИИ-ассистента, помогающего решать многоаспектные юридические задачи

    В первой части мы кратко рассмотрели предпосылки и последствия ИИ‑трансформации деятельности юристов, а также предложили вариант архитектуры продвинутой RAG‑системы, учитывающей особенности юридической предметной области. Во этой части мы проведем обзор общих и юридических бенчмарков, которые целесообразно учитывать при оценке технических компонент RAG, а также системы в целом. В заключение рассмотрим, как самостоятельно подготовить тестовый датасет для оценки RAG‑системы с помощью фреймворка RAGAS и разберем итоговые результаты эксперимента.

    habr.com/ru/companies/otus/art

    #RAG #retrievalaugmented_generation #LLM #Large_Language_Models #Эмбеддинги #Векторные_базы_данных #Векторные_хранилища #Индексация #Ранжирование

  24. Law & Practice Ensemble RAG. Как создать ИИ-ассистента, помогающего решать многоаспектные юридические задачи

    В первой части мы кратко рассмотрели предпосылки и последствия ИИ‑трансформации деятельности юристов, а также предложили вариант архитектуры продвинутой RAG‑системы, учитывающей особенности юридической предметной области. Во этой части мы проведем обзор общих и юридических бенчмарков, которые целесообразно учитывать при оценке технических компонент RAG, а также системы в целом. В заключение рассмотрим, как самостоятельно подготовить тестовый датасет для оценки RAG‑системы с помощью фреймворка RAGAS и разберем итоговые результаты эксперимента.

    habr.com/ru/companies/otus/art

    #RAG #retrievalaugmented_generation #LLM #Large_Language_Models #Эмбеддинги #Векторные_базы_данных #Векторные_хранилища #Индексация #Ранжирование

  25. Law & Practice Ensemble RAG. Как создать ИИ-ассистента, помогающего решать многоаспектные юридические задачи

    В первой части мы кратко рассмотрели предпосылки и последствия ИИ‑трансформации деятельности юристов, а также предложили вариант архитектуры продвинутой RAG‑системы, учитывающей особенности юридической предметной области. Во этой части мы проведем обзор общих и юридических бенчмарков, которые целесообразно учитывать при оценке технических компонент RAG, а также системы в целом. В заключение рассмотрим, как самостоятельно подготовить тестовый датасет для оценки RAG‑системы с помощью фреймворка RAGAS и разберем итоговые результаты эксперимента.

    habr.com/ru/companies/otus/art

    #RAG #retrievalaugmented_generation #LLM #Large_Language_Models #Эмбеддинги #Векторные_базы_данных #Векторные_хранилища #Индексация #Ранжирование

  26. Law & Practice Ensemble RAG. Как создать ИИ-ассистента, помогающего решать многоаспектные юридические задачи

    В первой части мы кратко рассмотрели предпосылки и последствия ИИ‑трансформации деятельности юристов, а также предложили вариант архитектуры продвинутой RAG‑системы, учитывающей особенности юридической предметной области. Во этой части мы проведем обзор общих и юридических бенчмарков, которые целесообразно учитывать при оценке технических компонент RAG, а также системы в целом. В заключение рассмотрим, как самостоятельно подготовить тестовый датасет для оценки RAG‑системы с помощью фреймворка RAGAS и разберем итоговые результаты эксперимента.

    habr.com/ru/companies/otus/art

    #RAG #retrievalaugmented_generation #LLM #Large_Language_Models #Эмбеддинги #Векторные_базы_данных #Векторные_хранилища #Индексация #Ранжирование

  27. Личный ИИ-ассистент на ваших данных. Часть 1: Векторная база ChromaDB + DeepSeek | GPT

    Сегодня поговорим о теме, которая вызывает живой интерес у многих разработчиков и энтузиастов ИИ — интеграции больших языковых моделей вроде DeepSeek или ChatGPT с собственной базой знаний. В этой статье я подробно расскажу, как работают векторные базы данных, зачем они нужны и какую роль играют в построении эффективной связки между вашей внутренней информацией и мощью современных LLM. Если вы хотите научиться «обучать» ИИ на своих данных — добро пожаловать!

    habr.com/ru/companies/amvera/a

    #python #deepseek #chatgpt #cromadb #векторные_базы_данных #rag #openai_api #langchain #база_знаний_поиск #chromadb_install

  28. Векторные БД vs Точность — часть 1

    Как я пытался собрать "по-быстрому" локальный RAG(retrieval augmentation generation), который будет находить термины из словаря Ожегова и поделиться об этом тут. На просторах интернетах все просто. Но на практике для моей задачи это оказалось не так. Точность...

    habr.com/ru/articles/807957/

    #llm #векторные_базы_данных #retrieval_augmented_generation #chromadb

  29. Как мы внедрили векторный поиск в Postgres Pro

    В статье разберемся, что такое векторный поиск, какие проблемы он решает, и как расширение pgpro_vector для Postgres Pro позволяет реализовать эти мощные возможности прямо в реляционной базе данных, без необходимости развертывать отдельные специализированные системы.

    habr.com/ru/companies/postgres

    #векторизация #вектор #векторные_базы_данных #векторный_поиск #postgres #postgres_pro #разработка_баз_данных #администрирование_баз_данных

  30. Векторные БД vs Точность — часть 2

    В первой части из тестов стало понятно, что в векторном поиске с терминами что-то не так. И точность достаточно низкая для корректной работы RAG (retrieval augmentation generation). Давайте попробуем гибридный поиск и посмотрим, что из этого получится.

    habr.com/ru/articles/817173/

    #llm #векторные_базы_данных #retrieval_augmented_generation #chroma #weaviate #qdrant

  31. Строим корпоративную GenAI-платформу: от концепции до ROI. Часть 3. Retrieval-Augmented Generation (RAG) на службе GenAI

    Это третья статья специалиста по архитектуре ИТ-систем и трансформации ИТ-ландшафта Дениса Прилепского из серии «Строим корпоративную GenAI-платформу: от концепции до ROI». Автор разбирает, что такое RAG и зачем он нужен, как устроена архитектура retrieval-уровня и почему он критически важен для достоверных ответов. В статье — пример генерации юридической справки, практические проблемы (задержки, кеширование, актуальность) и подготовка к следующей теме — guardrails.

    habr.com/ru/companies/mipt_dig

    #RAG #retrieval #векторные_базы_данных #эмбеддинги #LLM #корпоративные_ассистенты #кеширование #генерация_с_контекстом

  32. Личный ИИ-ассистент на ваших данных. Часть 2: Веб-интерфейс, авторизация и стриминг ответов от ИИ

    Продолжаем тему, которая вызывает живой интерес у многих разработчиков и энтузиастов ИИ — создание собственного ассистента на базе ChatGPT или DeepSeek с использованием личной базы знаний. В этой части статьи мы шаг за шагом превращаем консольную заготовку из первой части в полноценный веб-сервис: — реализуем авторизацию — создаём веб-чат с выбором нейросети — интегрируем всё через FastAPI — готовим к деплою Если вы хотите, чтобы ваш ИИ-ассистент выглядел и работал как настоящий сервис — поехали!

    habr.com/ru/companies/amvera/a

    #векторные_базы_данных #python #deepseek #chatgpt #langchain #openapi #openapi_api #fastapi #fastapi_stream #jinja2

  33. BlackWave: Как я создал симулятор соцсети с тысячами ИИ-ботов и почему перешёл на Python

    Эта статья — не просто рассказ о разработке. Это путь от сумасшедшей идеи «социальной сети для одного» до полноценной open-source платформы, где каждый бот — личность. Я поделюсь тем, как строил архитектуру, зачем отказался от C# в пользу Python и почему важно, чтобы ИИ-боты вели себя не как алгоритмы, а как настоящие люди. Читать

    habr.com/ru/articles/918848/

    #Python #Django #fastapi #искусственный_интеллект #социальные_сети #открытый_код #docker #dockercompose #ai #векторные_базы_данных

  34. [Перевод] О векторных базах данных простым языком

    Представьте, что управляете онлайн-магазином, предлагающим тысячи товаров. Чтобы помочь пользователям находить нужные позиции, вы добавили строку поиска. Теперь посетители могут вводить интересующие их запросы, на что вы будете показывать им подходящие результаты. Например, когда пользователь вводит «лето», вы можете показывать предметы вроде шортов, платьев, панам и пляжных зонтов. Как бы вы реализовали такую систему?

    habr.com/ru/companies/ruvds/ar

    #ruvds_переводы #векторные_базы_данных #postgres #mysql #python #машинное_обучение #алгоритмы #онлайнторговля

  35. Как мы внедрили векторный поиск в Postgres Pro

    В статье разберемся, что такое векторный поиск, какие проблемы он решает, и как расширение pgpro_vector для Postgres Pro позволяет реализовать эти мощные возможности прямо в реляционной базе данных, без необходимости развертывать отдельные специализированные системы.

    habr.com/ru/companies/postgres

    #векторизация #вектор #векторные_базы_данных #векторный_поиск #postgres #postgres_pro #разработка_баз_данных #администрирование_баз_данных

  36. Как мы внедрили векторный поиск в Postgres Pro

    В статье разберемся, что такое векторный поиск, какие проблемы он решает, и как расширение pgpro_vector для Postgres Pro позволяет реализовать эти мощные возможности прямо в реляционной базе данных, без необходимости развертывать отдельные специализированные системы.

    habr.com/ru/companies/postgres

    #векторизация #вектор #векторные_базы_данных #векторный_поиск #postgres #postgres_pro #разработка_баз_данных #администрирование_баз_данных

  37. Как мы внедрили векторный поиск в Postgres Pro

    В статье разберемся, что такое векторный поиск, какие проблемы он решает, и как расширение pgpro_vector для Postgres Pro позволяет реализовать эти мощные возможности прямо в реляционной базе данных, без необходимости развертывать отдельные специализированные системы.

    habr.com/ru/companies/postgres

    #векторизация #вектор #векторные_базы_данных #векторный_поиск #postgres #postgres_pro #разработка_баз_данных #администрирование_баз_данных

  38. Личный ИИ-ассистент на ваших данных. Часть 2: Веб-интерфейс, авторизация и стриминг ответов от ИИ

    Продолжаем тему, которая вызывает живой интерес у многих разработчиков и энтузиастов ИИ — создание собственного ассистента на базе ChatGPT или DeepSeek с использованием личной базы знаний. В этой части статьи мы шаг за шагом превращаем консольную заготовку из первой части в полноценный веб-сервис: — реализуем авторизацию — создаём веб-чат с выбором нейросети — интегрируем всё через FastAPI — готовим к деплою Если вы хотите, чтобы ваш ИИ-ассистент выглядел и работал как настоящий сервис — поехали!

    habr.com/ru/companies/amvera/a

    #векторные_базы_данных #python #deepseek #chatgpt #langchain #openapi #openapi_api #fastapi #fastapi_stream #jinja2

  39. Личный ИИ-ассистент на ваших данных. Часть 2: Веб-интерфейс, авторизация и стриминг ответов от ИИ

    Продолжаем тему, которая вызывает живой интерес у многих разработчиков и энтузиастов ИИ — создание собственного ассистента на базе ChatGPT или DeepSeek с использованием личной базы знаний. В этой части статьи мы шаг за шагом превращаем консольную заготовку из первой части в полноценный веб-сервис: — реализуем авторизацию — создаём веб-чат с выбором нейросети — интегрируем всё через FastAPI — готовим к деплою Если вы хотите, чтобы ваш ИИ-ассистент выглядел и работал как настоящий сервис — поехали!

    habr.com/ru/companies/amvera/a

    #векторные_базы_данных #python #deepseek #chatgpt #langchain #openapi #openapi_api #fastapi #fastapi_stream #jinja2

  40. Личный ИИ-ассистент на ваших данных. Часть 2: Веб-интерфейс, авторизация и стриминг ответов от ИИ

    Продолжаем тему, которая вызывает живой интерес у многих разработчиков и энтузиастов ИИ — создание собственного ассистента на базе ChatGPT или DeepSeek с использованием личной базы знаний. В этой части статьи мы шаг за шагом превращаем консольную заготовку из первой части в полноценный веб-сервис: — реализуем авторизацию — создаём веб-чат с выбором нейросети — интегрируем всё через FastAPI — готовим к деплою Если вы хотите, чтобы ваш ИИ-ассистент выглядел и работал как настоящий сервис — поехали!

    habr.com/ru/companies/amvera/a

    #векторные_базы_данных #python #deepseek #chatgpt #langchain #openapi #openapi_api #fastapi #fastapi_stream #jinja2