#chroma-db — Public Fediverse posts on home.social

michabbb @[email protected] · 2026-04-23 · 10:48 UTC

→ Mindlid: 20% lift in top-1 recall for wellness app

🔗 Available via #GeminiAPI & #VertexAI
Integrates with #LangChain, #LlamaIndex, #Haystack, #Weaviate, #Qdrant, #ChromaDB & Vector Search
🧪 Colab notebooks for Gemini API & Vertex AI ready to use

🌐
https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-embedding-2-generally-available/

#geminiapi #vertexai #langchain #llamaindex #haystack #weaviate

Habr @[email protected] · 2026-04-20 · 07:22 UTC

Собираем AI-агента нового поколения: Python, RAG и внешние инструменты через MCP (Model Context Protocol)

Ещё пару лет назад типичное LLM-приложение выглядело как последовательная цепочка вызовов: взяли промпт, добавили контекст из векторной базы, отправили в модель, получили ответ. LangChain популяризировал эту парадигму — chains, retrievers, memory — и это работало для простых сценариев вроде «ответь на вопрос по документации». Но бизнес-задачи редко укладываются в линейный пайплайн. Пользователь хочет не просто получить ответ, а чтобы система совершила действие : создала тикет в Jira, отправила письмо, запросила данные из CRM, проверила погоду и только потом сформулировала ответ. Именно здесь на сцену выходят AI-агенты — системы, которые не просто генерируют текст, а автономно принимают решение, какой инструмент вызвать , в каком порядке, и интерпретируют результат. Проблема в том, что до недавнего времени подключение каждого нового инструмента требовало написания «клея» — кастомных функций, обёрнутых в @tool декоратор LangChain, с ручным управлением аутентификацией, обработкой ошибок и сериализацией данных. Для продакшена это быстро превращалось в зоопарк нестандартных интеграций, который сложно поддерживать и масштабировать. Model Context Protocol (MCP) от Anthropic решает эту проблему, предлагая единый стандарт для подключения инструментов и источников данных к LLM-приложениям. Вместо того чтобы для каждого API писать свой адаптер, мы просто запускаем MCP-сервер, который предоставляет инструменты по стандартизированному протоколу. Агент подключается к этому серверу через MCP-клиент и получает доступ ко всем инструментам без лишнего кода. В этой статье мы соберём полноценного агента, который: 1. Умеет работать с внешним миром через MCP (узнавать погоду и создавать GitHub Issues); 2. Имеет доступ к внутренней базе знаний через RAG; 3. Принимает решения по ReAct-подходу с использованием LangGraph. Разбираем код и архитектуру

https://habr.com/ru/articles/1025428/

#python #ai #machine_learning #langchain #langgraph #mcp #rag #chromadb #fastmcp #llm

#llm #fastmcp #chromadb #rag #mcp #langgraph

Habr @[email protected] · 2026-04-08 · 10:52 UTC

Мультиагентная система без LangChain: почему абстракции ломаются и как строить production на чистом Python

LangChain обещает: переключите модель одной строкой, подключите RAG за две. У меня в production мультиагентная система с RAG, CRM и тремя мессенджерами — и я построил её без LangChain. Под катом — почему абстракции ломаются, сколько стоит фоллбек на YandexGPT и при чём тут медведь с удочкой.

https://habr.com/ru/articles/1020810/

#LangChain #Python #мультиагентная_система #RAG #LLM #YandexGPT #OpenAI #FastAPI #production #ChromaDB

#chromadb #production #fastapi #openai #yandexgpt #llm

Linux Professional Institute @LPI · 2026-03-23 · 14:49 UTC

Databases for #AI: Should you use a vector #database? 🤔

This article compares #opensource projects competing to handle modern #AI workloads, including #machinelearning and #LLMs. Discover which databases best meet today’s AI challenges: https://lpi.org/636x

(Disclaimer: This post contains an AI-generated image.)

#AndyOram #AI #vectordatabase #machinelearning #LLMs #SQL #opensource #hybridsearch #generativeAI #MariaDB #MongoDB #Milvus #Qdrant #Weaviate #Vespa #ChromaDB #LanceDB

#ai #database #opensource #machinelearning #llms #andyoram

ViennaMike @[email protected] · 2026-03-18 · 03:03 UTC

Building My First RAG System (Which Sadly Failed the Tax Preparer Exam)
A while back, I posted about how I gave the IRS’ volunteer tax preparer exam to ChatGPT. It scored in the 70s, but an 80% is the minimum required score to pass and be certified. A short while later, I took a Coursera short course on Retrieval Augmented Generation (RAG). I then decided to
https://www.mcgurrin.info/robots/8318/
#Uncategorized #AI #chatbots #chromadB #gradio #llamaparse #LLMs #ollama #python #RAG #Taxes

#uncategorized #ai #chatbots #chromadb #gradio #llamaparse

Habr @[email protected] · 2026-03-04 · 22:12 UTC

Как мы с ИИ сделали локальный ИИ, который учится по моим книгам и пишет за меня отчёты

Я с GitHub Copilot (Claude) собрал полностью локальную RAG-систему с GUI, которая индексирует мои учебники и генерирует по ним отчёты, презентации, конспекты и эссе. Всё работает офлайн. В статье — архитектура, выбор компонентов, процесс совместной разработки с ИИ-ассистентом, грабли и рабочий код.

https://habr.com/ru/articles/1006662/

#python #ai #nlp #LLM #qwen #copilot #claude #chromadb

#chromadb #claude #copilot #qwen #llm #nlp

Habr @[email protected] · 2026-02-24 · 06:42 UTC

Базовый минимум. Часть 3: RAG-системы

Большая языковая модель это не источник актуальных сведений, а статистическая система, обученная на данных прошлого. Она не обращается к внешним базам знаний и не узнает о новых событиях. Все что она знает было усвоено на этапе обучения и зафиксировано в ее параметрах. В современных прикладных системах это ограничение часто скрыто за инструментами, поиском и дополнительными модулями. Однако именно архитектурный подход Retrieval-Augmented Generation, RAG стал стандартным способом расширения возможностей модели без ее дообучения. Он позволяет подключать внешние базы знаний, работать с актуальными документами и заметно снижать количество галлюцинаций. В третьей части серии Базовый минимум разбирается как устроен RAG и как реализовать его минимальную рабочую версию на практике.

https://habr.com/ru/articles/1002152/

#RAG #RetrievalAugmented_Generation #языковые_модели #векторная_база_данных #эмбеддинги #чанкование #семантический_поиск #векторный_индекс #ChromaDB #Hugging_Face

#hugging_face #chromadb #векторный_индекс #семантический_поиск #чанкование #эмбеддинги

Habr @[email protected] · 2026-02-09 · 17:42 UTC

Мой локальный агент помнит проект лучше меня. Контекст — 32K токенов. Расскажу, как

Мой агент на Llama 3.1 8B в третий раз спросил, как меня зовут. Я представился 200 сообщений назад. Контекст переполнился — начало разговора уехало. Большие контексты не спасают: дорого, «Lost in the Middle», локально не влезает. Суммаризация теряет детали. Я сделал по-другому — три типа внешней памяти: Redis для фактов, ChromaDB для семантического поиска, файлы для документов. Контекст маленький, память большая. Внутри — код на Python и грабли, на которые я уже наступил.

https://habr.com/ru/articles/994618/

#LLM #AIагенты #память_LLM #RAG #Redis #ChromaDB #векторный_поиск #sentencetransformers #llama #локальные_модели

#локальные_модели #llama #sentencetransformers #векторный_поиск #chromadb #redis

N-gated Hacker News @[email protected] · 2026-01-14 · 23:39 UTC

Ah, yet another "modern, beautiful" app that promises to revolutionize your #ChromaDB experience 🙄. Because who doesn't want to manage their vector embeddings while sipping overpriced macchiatos at the local cafe? ☕✨ But hey, at least it has 13 embedding providers, because apparently 12 just wouldn't cut it! 🤷‍♂️
https://www.chroma-explorer.com/ #modernapps #vector_embeddings #techhumor #appreviews #cafevibes #HackerNews #ngated

#chromadb #modernapps #vector_embeddings #techhumor #appreviews #cafevibes

Hacker News @[email protected] · 2026-01-14 · 23:39 UTC

ChromaDB Explorer

https://www.chroma-explorer.com/

#HackerNews #ChromaDB #Explorer #ChromaDB #DataVisualization #TechInnovation #DatabaseExplorer

#hackernews #chromadb #explorer #datavisualization #techinnovation #databaseexplorer

:rss: Hacker News @[email protected] · 2026-01-14 · 23:27 UTC

ChromaDB Explorer
https://www.chroma-explorer.com/
#ycombinator #ChromaDB #vector_database #embeddings #desktop_app #macOS #database_client #machine_learning #semantic_search

#ycombinator #chromadb #vector_database #embeddings #desktop_app #macos

Fábio Costa 🐇🕐🎩☕ @[email protected] · 2026-01-14 · 22:38 UTC

Alguém conhece um bom tutorial de #RAG que não use o #ChromaDB como banco vetorial? O desgraçado não está funcionando no #Python 3.10 ou maior graças ao #Pylance

#rag #chromadb #python #pylance

Habr @[email protected] · 2025-12-11 · 09:12 UTC

От страха к успеху: история появления ИИ-помощника в системе «АФИДА»

Привет, Хабр! На связи снова Всеволод Зайковский, заместитель руководителя проекта в «Газпром ЦПС». В прошлый раз я рассказывал, как мы научили нашу систему «АФИДА» распознавать и раскладывать по полочкам тысячи строительных актов с помощью компьютерного зрения. Хаос был побежден, документы оцифрованы, лежали в нужных папках, и их даже можно было найти. Казалось бы — живи и радуйся, но аппетит приходит во время еды. Мы поняли, что система «видит» текст, и задали логичный вопрос: «А можно просто спросить у нее, какую марку бетона использовали для заливки фундамента, и она ответит?». Подумали и решили, что можно. Тогда нам казалось, что прикрутить LLM к нашему архиву, чтобы она работала как умный поисковик, очень просто. Но все оказалось не так радужно. Первая версия нашего «строительного чат-бота» галлюцинировала так, что путала проектную документацию с веб-дизайном, а ответы генерировались по три минуты. Это история о том, как мы прошли путь от игрушечного чат-бота до полноценной RAG-системы в закрытом контуре. Расскажу, как мы запускали нейросети на CPU, почему в нашем сравнительном тесте победил Qwen, и как мы оценивали качество ответов в Excel, когда поняли, что стандартные бенчмарки нам не подходят. Статья будет полезна архитекторам, ML-инженерам, и руководителям, которые ищут рабочие on-premise решения. Если вы тоже пытаетесь внедрить LLM в энтерпрайз без бюджета и тысячи видеокарт — этот кейс для вас.

https://habr.com/ru/companies/gazpromcps/articles/975596/

#Искусственный_интеллект #RAG #Корпоративные_решения #ChromaDB #Qwen #Интеграция_AI #llm #Бэнчмарк

#бэнчмарк #llm #интеграция_ai #qwen #chromadb #корпоративные_решения

o lаvrоvsky @[email protected] · 2025-11-10 · 17:27 UTC

With quite reasonable performance, the #ChromaDB backend selects filters and dives into multi-page transcripts with ease - soon this internal project will be opened up to more users, along with API access (stay tuned!)

#chromadb

A Matt with a Dog @[email protected] · 2025-11-04 · 18:12 UTC

In my latest blogpost, we continue our open-source journey with AI, building a lab system to understand how RAG actually works. Is it all it's cracked up to be?
https://mattjhayes.com/2025/10/31/putting-the-open-back-in-ai-part-2-rag/
Here's an analogy from the conclusion:
"Keeping an LLM under control in the face of random and potentially malicious user input is like trying to ride horseback with no reigns,
steering only by whispering instructions in the horse’s ear. When you’re used to the predictability of driving a car, you may find this unsettling and a bit odd. Results will vary."
No matter what your views are on AI, it is worth taking the time to understand the
technology so to have an informed view on it.
#AI #RAG #OpenSource #LLM #Ollama #ChromaDB #Codeberg

#ai #rag #opensource #llm #ollama #chromadb

Habr @[email protected] · 2025-10-29 · 12:22 UTC

Как я собрал AI-ассистента для отца с больным сердцем: Tool-Calling RAG Pipeline на GPT-4o-mini без LangChain

Мой отец — человек, переживший несколько сложнейших операций на сердце. Жизнь с хроническим заболеванием — это бесконечный поток анализов, заключений и схем приёма лекарств. Находясь далеко (я живу во Вьетнаме), я постоянно волновался: не забудет ли он про дозу, правильно ли понял назначение, задал ли все нужные вопросы врачу? Мне нужен был не просто бот-напоминалка, а второй пилот — умный, конфиденциальный и мультимодальный AI-Кардиолог . Ассистент, который знает его анамнез наизусть, понимает голосовые команды и может «прочитать» фотографию свежего анализа. Я решил собрать полноценный автономный агент с возможностью вызова внешних инструментов ( Tool‑Calling ) и локальной базой знаний ( RAG ), но без использования громоздких фреймворков вроде LangChain или LlamaIndex.

https://habr.com/ru/articles/961280/

#ai #rag #tool_calling #python #telegrambot #gpt4o_mini #chromadb #ocrтехнологии #медицина #llm

#llm #медицина #ocrтехнологии #chromadb #gpt4o_mini #telegrambot

Habr @[email protected] · 2025-10-29 · 08:22 UTC

Выбираем векторную БД для AI-агентов и RAG: большой обзор баз данных и поиск смысла

В этой статье я сделал обзор основных векторных баз данных: Milvus, Qdrant, Weaviate, ChromaDB, pgvector, Redis, pgvectorscale, LanceDB, ClickHouse, Vespa, Marqo, ElasticSearch. Если вы запутались в разнообразии векторных баз данных или хочется верхнеуровнево понимать как они устроены, чем отличаются и для чего вообще нужны, то эта статья будет очень полезна. Мы пошагово соберем все ожидания от векторных БД, посмотрим бенчмарки, а затем попробуем собрать все воедино.

https://habr.com/ru/articles/961088/

#базы_данных #milvus #pgvector #qdrant #redis #chroma #chromadb #ииагенты #aiагенты #LLM

#llm #aiагенты #ииагенты #chromadb #chroma #redis

Habr @[email protected] · 2025-10-16 · 12:12 UTC

[Перевод] Как я построил RAG-систему за вечер с помощью 5 open source-инструментов

Команда Python for Devs подготовила практическое руководство по сборке полноценной RAG-системы из пяти open source-инструментов. MarkItDown, LangChain, ChromaDB, Ollama и Gradio превращают разрозненные документы в умную базу знаний с потоковой генерацией ответов. Всё локально, без облаков и с открытым кодом — попробуйте собрать свой ChatGPT прямо у себя.

https://habr.com/ru/articles/955798/

#python #rag #chromadb #ollama #hnsw #langchain

#langchain #hnsw #ollama #chromadb #rag #python

All Things Open @[email protected] · 2025-08-13 · 16:02 UTC

🚀 NEW on We ❤️ Open Source 🚀

Build your own private AI assistant with Bookshelf! LangChain + ChromaDB + Streamlit make it easy to turn notes & PDFs into a searchable RAG-powered knowledge base—local, private, and open source.

Read more about Ash Tawari's talk: https://allthingsopen.org/articles/build-private-ai-assistant-bookshelf

#WeLoveOpenSource #AI #OpenSource #Privacy #LangChain #ChromaDB #Streamlit

#weloveopensource #ai #opensource #privacy #langchain #chromadb

Dawisco @[email protected] · 2025-06-10 · 16:58 UTC

I'm using Gemini AI to help me debug my Python code to build a local cybersecurity RAG vector database for a local DeepSeek AI and it feels very oroborous

#ai #deepseek #rag #chromadb #python #cyberserurity

Jesus Castagnetto 🇵🇪 @[email protected] · 2025-04-17 · 11:34 UTC

From #FreeCodeCamp: "How to Build a Local #RAG App with #Ollama and #ChromaDB in the R Programming Language"

https://www.freecodecamp.org/news/build-a-local-rag-app-with-ollama-and-chromadb-in-r/

#RStats #AI #LLM

#freecodecamp #rag #ollama #chromadb #rstats #ai

Alvin Ashcraft 🐿️ @[email protected] · 2025-02-20 · 20:00 UTC

Announcing Chroma DB C# SDK.

https://devblogs.microsoft.com/dotnet/announcing-chroma-db-csharp-sdk/?hide_banner=true

#dotnet #chromadb #ai #oss #database #csharp

Habr @[email protected] · 2025-01-20 · 06:22 UTC

Security-RAG или как сделать AI Security tool на коленке

LLM-ки и LLM-агенты продолжают наводить шум. Cтатьи про то как сделать очередной RAG или Агента продолжают клепаться (да блин даже мы одна из этих статей), huggingface выпускают smolagents , квантизация позволяет дойти LLM-кам до простых работяг и обывателей, давая им возможность в них потыкаться в той же LM studio или других приложениях. Пока бизнес спешит внедрить очередного виртуального помощника, тот зачастую превращается в неумелого продавца, который не только мешает клиентам связаться со службой поддержки, но и... Удиви меня

https://habr.com/ru/articles/874820/

#llm #llmattack #llmприложения #ml #langchain #langfuse #chromadb #промптинъекции #искусственный_интеллект

#искусственный_интеллект #промптинъекции #chromadb #langfuse #langchain #ml

AlexCrimi @[email protected] · 2024-12-23 · 09:51 UTC

I had some fun putting together #KnowledgeGraph and RAG for #LLMs
The idea is that the vector embedding to extend the knowledge of an LLM is reinforced by a knowledge graph.
Here full explanation and code including GUI, permanent storage with #Chromadb, etc:
https://medium.com/towards-artificial-intelligence/how-i-built-an-llm-app-based-on-graph-rag-system-with-chromadb-and-chainlit-f70c9cca4400

it seems even more cumbersome as they say in Matsumoto et al. https://academic.oup.com/bioinformatics/article/40/6/btae353/7687047

or maybe it has to do with the size of the graph, as suggested here https://arxiv.org/abs/2404.16130

Let me know what you think about it

#knowledgegraph #llms #chromadb

Joe Steinbring :thisisfine: @[email protected] · 2024-05-30 · 21:14 UTC

@grimmy Every time you run the script, it gets the JSON feed from the Kopp’s website, builds a collection in a #ChromaDB vector database, populates it with what today is, what today’s flavor is, and what tomorrow’s flavor is, and then uses that for the embedding. I wasn’t expecting to need to tell it what today’s date is.

#Ollama #Python

#chromadb #ollama #python

Habr @[email protected] · 2024-04-15 · 22:22 UTC

Векторные БД vs Точность — часть 1

Как я пытался собрать "по-быстрому" локальный RAG(retrieval augmentation generation), который будет находить термины из словаря Ожегова и поделиться об этом тут. На просторах интернетах все просто. Но на практике для моей задачи это оказалось не так. Точность...

https://habr.com/ru/articles/807957/

#llm #векторные_базы_данных #retrieval_augmented_generation #chromadb

#chromadb #retrieval_augmented_generation #векторные_базы_данных #llm

Ferdinando Simonetti @[email protected] · 2024-03-12 · 20:32 UTC

[ Implementing semantic cache to improve a RAG system with FAISS. - Hugging Face Open-Source AI Cookbook ]
https://huggingface.co/learn/cookbook/semantic_cache_chroma_vector_database #RAG #ChromaDB #FAISS #Cache

#rag #chromadb #faiss #cache