home.social

#полнотекстовый — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #полнотекстовый, aggregated by home.social.

  1. [Перевод] Postgres как поисковый движок

    Поиск — это сложно. Важная часть многих приложений, которую нелегко реализовать правильно. Особенно в случае с RAG-пайплайнами, где на качество поиска завязан весь процесс. Хотя семантический поиск в моде, старый добрый лексический поиск по-прежнему остается базой. Семантические методы могут улучшить результаты, но эффективнее всего они работают, когда добавляются к прочному фундаменту текстового поиска. Эрик Закариассон, разработчик и автор блога Anyblockers, рассмотрел в своей статье, как использовать Postgres для создания надёжной поисковой системы. В рамках задачи автор объединил три техники: 1. Полнотекстовый поиск с tsvector 2. Семантический поиск с pgvector 3. Нечёткое сопоставление с pg_trgm 4. Бонус: BM25 Возможно, это не оптимальный подход для любой ситуации, но отличная альтернатива созданию отдельного поискового сервиса; отправная точка, которую можно реализовать и масштабировать в рамках существующей базы данных Postgres.

    habr.com/ru/companies/sravni/a

    #postgresql #поисковый_движок #полнотекстовый #семантический_поиск #нечеткий_поиск