home.social

#chroma-db — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #chroma-db, aggregated by home.social.

fetched live
  1. Собираем AI-агента нового поколения: Python, RAG и внешние инструменты через MCP (Model Context Protocol)

    Ещё пару лет назад типичное LLM-приложение выглядело как последовательная цепочка вызовов: взяли промпт, добавили контекст из векторной базы, отправили в модель, получили ответ. LangChain популяризировал эту парадигму — chains, retrievers, memory — и это работало для простых сценариев вроде «ответь на вопрос по документации». Но бизнес-задачи редко укладываются в линейный пайплайн. Пользователь хочет не просто получить ответ, а чтобы система совершила действие : создала тикет в Jira, отправила письмо, запросила данные из CRM, проверила погоду и только потом сформулировала ответ. Именно здесь на сцену выходят AI-агенты — системы, которые не просто генерируют текст, а автономно принимают решение, какой инструмент вызвать , в каком порядке, и интерпретируют результат. Проблема в том, что до недавнего времени подключение каждого нового инструмента требовало написания «клея» — кастомных функций, обёрнутых в @tool декоратор LangChain, с ручным управлением аутентификацией, обработкой ошибок и сериализацией данных. Для продакшена это быстро превращалось в зоопарк нестандартных интеграций, который сложно поддерживать и масштабировать. Model Context Protocol (MCP) от Anthropic решает эту проблему, предлагая единый стандарт для подключения инструментов и источников данных к LLM-приложениям. Вместо того чтобы для каждого API писать свой адаптер, мы просто запускаем MCP-сервер, который предоставляет инструменты по стандартизированному протоколу. Агент подключается к этому серверу через MCP-клиент и получает доступ ко всем инструментам без лишнего кода. В этой статье мы соберём полноценного агента, который: 1. Умеет работать с внешним миром через MCP (узнавать погоду и создавать GitHub Issues); 2. Имеет доступ к внутренней базе знаний через RAG; 3. Принимает решения по ReAct-подходу с использованием LangGraph. Разбираем код и архитектуру

    habr.com/ru/articles/1025428/

    #python #ai #machine_learning #langchain #langgraph #mcp #rag #chromadb #fastmcp #llm

  2. Мультиагентная система без LangChain: почему абстракции ломаются и как строить production на чистом Python

    LangChain обещает: переключите модель одной строкой, подключите RAG за две. У меня в production мультиагентная система с RAG, CRM и тремя мессенджерами — и я построил её без LangChain. Под катом — почему абстракции ломаются, сколько стоит фоллбек на YandexGPT и при чём тут медведь с удочкой.

    habr.com/ru/articles/1020810/

    #LangChain #Python #мультиагентная_система #RAG #LLM #YandexGPT #OpenAI #FastAPI #production #ChromaDB

  3. Databases for : Should you use a vector ? 🤔

    This article compares projects competing to handle modern workloads, including and . Discover which databases best meet today’s AI challenges: lpi.org/636x

    (Disclaimer: This post contains an AI-generated image.)

  4. Building My First RAG System (Which Sadly Failed the Tax Preparer Exam)
    A while back, I posted about how I gave the IRS’ volunteer tax preparer exam to ChatGPT. It scored in the 70s, but an 80% is the minimum required score to pass and be certified. A short while later, I took a Coursera short course on Retrieval Augmented Generation (RAG). I then decided to
    mcgurrin.info/robots/8318/
    #Uncategorized #AI #chatbots #chromadB #gradio #llamaparse #LLMs #ollama #python #RAG #Taxes

  5. Как мы с ИИ сделали локальный ИИ, который учится по моим книгам и пишет за меня отчёты

    Я с GitHub Copilot (Claude) собрал полностью локальную RAG-систему с GUI, которая индексирует мои учебники и генерирует по ним отчёты, презентации, конспекты и эссе. Всё работает офлайн. В статье — архитектура, выбор компонентов, процесс совместной разработки с ИИ-ассистентом, грабли и рабочий код.

    habr.com/ru/articles/1006662/

    #python #ai #nlp #LLM #qwen #copilot #claude #chromadb

  6. Базовый минимум. Часть 3: RAG-системы

    Большая языковая модель это не источник актуальных сведений, а статистическая система, обученная на данных прошлого. Она не обращается к внешним базам знаний и не узнает о новых событиях. Все что она знает было усвоено на этапе обучения и зафиксировано в ее параметрах. В современных прикладных системах это ограничение часто скрыто за инструментами, поиском и дополнительными модулями. Однако именно архитектурный подход Retrieval-Augmented Generation, RAG стал стандартным способом расширения возможностей модели без ее дообучения. Он позволяет подключать внешние базы знаний, работать с актуальными документами и заметно снижать количество галлюцинаций. В третьей части серии Базовый минимум разбирается как устроен RAG и как реализовать его минимальную рабочую версию на практике.

    habr.com/ru/articles/1002152/

    #RAG #RetrievalAugmented_Generation #языковые_модели #векторная_база_данных #эмбеддинги #чанкование #семантический_поиск #векторный_индекс #ChromaDB #Hugging_Face

  7. Мой локальный агент помнит проект лучше меня. Контекст — 32K токенов. Расскажу, как

    Мой агент на Llama 3.1 8B в третий раз спросил, как меня зовут. Я представился 200 сообщений назад. Контекст переполнился — начало разговора уехало. Большие контексты не спасают: дорого, «Lost in the Middle», локально не влезает. Суммаризация теряет детали. Я сделал по-другому — три типа внешней памяти: Redis для фактов, ChromaDB для семантического поиска, файлы для документов. Контекст маленький, память большая. Внутри — код на Python и грабли, на которые я уже наступил.

    habr.com/ru/articles/994618/

    #LLM #AIагенты #память_LLM #RAG #Redis #ChromaDB #векторный_поиск #sentencetransformers #llama #локальные_модели

  8. Ah, yet another "modern, beautiful" app that promises to revolutionize your #ChromaDB experience 🙄. Because who doesn't want to manage their vector embeddings while sipping overpriced macchiatos at the local cafe? ☕✨ But hey, at least it has 13 embedding providers, because apparently 12 just wouldn't cut it! 🤷‍♂️
    chroma-explorer.com/ #modernapps #vector_embeddings #techhumor #appreviews #cafevibes #HackerNews #ngated

  9. Alguém conhece um bom tutorial de #RAG que não use o #ChromaDB como banco vetorial? O desgraçado não está funcionando no #Python 3.10 ou maior graças ao #Pylance

  10. От страха к успеху: история появления ИИ-помощника в системе «АФИДА»

    Привет, Хабр! На связи снова Всеволод Зайковский, заместитель руководителя проекта в «Газпром ЦПС». В прошлый раз я рассказывал, как мы научили нашу систему «АФИДА» распознавать и раскладывать по полочкам тысячи строительных актов с помощью компьютерного зрения. Хаос был побежден, документы оцифрованы, лежали в нужных папках, и их даже можно было найти. Казалось бы — живи и радуйся, но аппетит приходит во время еды. Мы поняли, что система «видит» текст, и задали логичный вопрос: «А можно просто спросить у нее, какую марку бетона использовали для заливки фундамента, и она ответит?». Подумали и решили, что можно. Тогда нам казалось, что прикрутить LLM к нашему архиву, чтобы она работала как умный поисковик, очень просто. Но все оказалось не так радужно. Первая версия нашего «строительного чат-бота» галлюцинировала так, что путала проектную документацию с веб-дизайном, а ответы генерировались по три минуты. Это история о том, как мы прошли путь от игрушечного чат-бота до полноценной RAG-системы в закрытом контуре. Расскажу, как мы запускали нейросети на CPU, почему в нашем сравнительном тесте победил Qwen, и как мы оценивали качество ответов в Excel, когда поняли, что стандартные бенчмарки нам не подходят. Статья будет полезна архитекторам, ML-инженерам, и руководителям, которые ищут рабочие on-premise решения. Если вы тоже пытаетесь внедрить LLM в энтерпрайз без бюджета и тысячи видеокарт — этот кейс для вас.

    habr.com/ru/companies/gazpromc

    #Искусственный_интеллект #RAG #Корпоративные_решения #ChromaDB #Qwen #Интеграция_AI #llm #Бэнчмарк

  11. With quite reasonable performance, the #ChromaDB backend selects filters and dives into multi-page transcripts with ease - soon this internal project will be opened up to more users, along with API access (stay tuned!)

  12. In my latest blogpost, we continue our open-source journey with AI, building a lab system to understand how RAG actually works. Is it all it's cracked up to be?
    mattjhayes.com/2025/10/31/putt
    Here's an analogy from the conclusion:
    "Keeping an LLM under control in the face of random and potentially malicious user input is like trying to ride horseback with no reigns,
    steering only by whispering instructions in the horse’s ear. When you’re used to the predictability of driving a car, you may find this unsettling and a bit odd. Results will vary."
    No matter what your views are on AI, it is worth taking the time to understand the
    technology so to have an informed view on it.
    #AI #RAG #OpenSource #LLM #Ollama #ChromaDB #Codeberg

  13. Как я собрал AI-ассистента для отца с больным сердцем: Tool-Calling RAG Pipeline на GPT-4o-mini без LangChain

    Мой отец — человек, переживший несколько сложнейших операций на сердце. Жизнь с хроническим заболеванием — это бесконечный поток анализов, заключений и схем приёма лекарств. Находясь далеко (я живу во Вьетнаме), я постоянно волновался: не забудет ли он про дозу, правильно ли понял назначение, задал ли все нужные вопросы врачу? Мне нужен был не просто бот-напоминалка, а второй пилот — умный, конфиденциальный и мультимодальный AI-Кардиолог . Ассистент, который знает его анамнез наизусть, понимает голосовые команды и может «прочитать» фотографию свежего анализа. Я решил собрать полноценный автономный агент с возможностью вызова внешних инструментов ( Tool‑Calling ) и локальной базой знаний ( RAG ), но без использования громоздких фреймворков вроде LangChain или LlamaIndex.

    habr.com/ru/articles/961280/

    #ai #rag #tool_calling #python #telegrambot #gpt4o_mini #chromadb #ocrтехнологии #медицина #llm

  14. Выбираем векторную БД для AI-агентов и RAG: большой обзор баз данных и поиск смысла

    В этой статье я сделал обзор основных векторных баз данных: Milvus, Qdrant, Weaviate, ChromaDB, pgvector, Redis, pgvectorscale, LanceDB, ClickHouse, Vespa, Marqo, ElasticSearch. Если вы запутались в разнообразии векторных баз данных или хочется верхнеуровнево понимать как они устроены, чем отличаются и для чего вообще нужны, то эта статья будет очень полезна. Мы пошагово соберем все ожидания от векторных БД, посмотрим бенчмарки, а затем попробуем собрать все воедино.

    habr.com/ru/articles/961088/

    #базы_данных #milvus #pgvector #qdrant #redis #chroma #chromadb #ииагенты #aiагенты #LLM

  15. [Перевод] Как я построил RAG-систему за вечер с помощью 5 open source-инструментов

    Команда Python for Devs подготовила практическое руководство по сборке полноценной RAG-системы из пяти open source-инструментов. MarkItDown, LangChain, ChromaDB, Ollama и Gradio превращают разрозненные документы в умную базу знаний с потоковой генерацией ответов. Всё локально, без облаков и с открытым кодом — попробуйте собрать свой ChatGPT прямо у себя.

    habr.com/ru/articles/955798/

    #python #rag #chromadb #ollama #hnsw #langchain

  16. 🚀 NEW on We ❤️ Open Source 🚀

    Build your own private AI assistant with Bookshelf! LangChain + ChromaDB + Streamlit make it easy to turn notes & PDFs into a searchable RAG-powered knowledge base—local, private, and open source.

    Read more about Ash Tawari's talk: allthingsopen.org/articles/bui

    #WeLoveOpenSource #AI #OpenSource #Privacy #LangChain #ChromaDB #Streamlit

  17. I'm using Gemini AI to help me debug my Python code to build a local cybersecurity RAG vector database for a local DeepSeek AI and it feels very oroborous

    #ai #deepseek #rag #chromadb #python #cyberserurity

  18. Security-RAG или как сделать AI Security tool на коленке

    LLM-ки и LLM-агенты продолжают наводить шум. Cтатьи про то как сделать очередной RAG или Агента продолжают клепаться (да блин даже мы одна из этих статей), huggingface выпускают smolagents , квантизация позволяет дойти LLM-кам до простых работяг и обывателей, давая им возможность в них потыкаться в той же LM studio или других приложениях. Пока бизнес спешит внедрить очередного виртуального помощника, тот зачастую превращается в неумелого продавца, который не только мешает клиентам связаться со службой поддержки, но и... Удиви меня

    habr.com/ru/articles/874820/

    #llm #llmattack #llmприложения #ml #langchain #langfuse #chromadb #промптинъекции #искусственный_интеллект

  19. I had some fun putting together #KnowledgeGraph and RAG for #LLMs
    The idea is that the vector embedding to extend the knowledge of an LLM is reinforced by a knowledge graph.
    Here full explanation and code including GUI, permanent storage with #Chromadb, etc:
    medium.com/towards-artificial-

    it seems even more cumbersome as they say in Matsumoto et al. academic.oup.com/bioinformatic

    or maybe it has to do with the size of the graph, as suggested here arxiv.org/abs/2404.16130

    Let me know what you think about it

  20. @grimmy Every time you run the script, it gets the JSON feed from the Kopp’s website, builds a collection in a #ChromaDB vector database, populates it with what today is, what today’s flavor is, and what tomorrow’s flavor is, and then uses that for the embedding. I wasn’t expecting to need to tell it what today’s date is.

    #Ollama #Python

  21. Векторные БД vs Точность — часть 1

    Как я пытался собрать "по-быстрому" локальный RAG(retrieval augmentation generation), который будет находить термины из словаря Ожегова и поделиться об этом тут. На просторах интернетах все просто. Но на практике для моей задачи это оказалось не так. Точность...

    habr.com/ru/articles/807957/

    #llm #векторные_базы_данных #retrieval_augmented_generation #chromadb