#корпоративный_поиск — Public Fediverse posts
Live and recent posts from across the Fediverse tagged #корпоративный_поиск, aggregated by home.social.
-
RAG в энтерпрайзе: почему демо работает, а прод нет
Представьте себе типичное совещание. Кто-то из руководства возвращается с конференции, садится напротив и говорит: «У них там бот по внутренней документации, надо себе такой же. До конца квартала». Через четыре месяца у тебя есть Pinecone, OpenAI API, две недели работы над парсингом PDF и чат-бот, который на демо отвечает на пять подобранных вопросов идеально. А на шестой, который задаст любой нормальный сотрудник, отвечает уверенным бредом. Дальше про то, что именно между этими двумя состояниями происходит. Но без «правильной архитектуры RAG», потому что такой не существует.
https://habr.com/ru/articles/1038670/
#RAG #LLM #retrievalaugmented_generation #векторные_базы_данных #эмбеддинги #чанкинг #корпоративный_поиск #галлюцинации_LLM #OpenAI #Pinecone
-
RAG в энтерпрайзе: почему демо работает, а прод нет
Представьте себе типичное совещание. Кто-то из руководства возвращается с конференции, садится напротив и говорит: «У них там бот по внутренней документации, надо себе такой же. До конца квартала». Через четыре месяца у тебя есть Pinecone, OpenAI API, две недели работы над парсингом PDF и чат-бот, который на демо отвечает на пять подобранных вопросов идеально. А на шестой, который задаст любой нормальный сотрудник, отвечает уверенным бредом. Дальше про то, что именно между этими двумя состояниями происходит. Но без «правильной архитектуры RAG», потому что такой не существует.
https://habr.com/ru/articles/1038670/
#RAG #LLM #retrievalaugmented_generation #векторные_базы_данных #эмбеддинги #чанкинг #корпоративный_поиск #галлюцинации_LLM #OpenAI #Pinecone
-
RAG в энтерпрайзе: почему демо работает, а прод нет
Представьте себе типичное совещание. Кто-то из руководства возвращается с конференции, садится напротив и говорит: «У них там бот по внутренней документации, надо себе такой же. До конца квартала». Через четыре месяца у тебя есть Pinecone, OpenAI API, две недели работы над парсингом PDF и чат-бот, который на демо отвечает на пять подобранных вопросов идеально. А на шестой, который задаст любой нормальный сотрудник, отвечает уверенным бредом. Дальше про то, что именно между этими двумя состояниями происходит. Но без «правильной архитектуры RAG», потому что такой не существует.
https://habr.com/ru/articles/1038670/
#RAG #LLM #retrievalaugmented_generation #векторные_базы_данных #эмбеддинги #чанкинг #корпоративный_поиск #галлюцинации_LLM #OpenAI #Pinecone
-
RAG в энтерпрайзе: почему демо работает, а прод нет
Представьте себе типичное совещание. Кто-то из руководства возвращается с конференции, садится напротив и говорит: «У них там бот по внутренней документации, надо себе такой же. До конца квартала». Через четыре месяца у тебя есть Pinecone, OpenAI API, две недели работы над парсингом PDF и чат-бот, который на демо отвечает на пять подобранных вопросов идеально. А на шестой, который задаст любой нормальный сотрудник, отвечает уверенным бредом. Дальше про то, что именно между этими двумя состояниями происходит. Но без «правильной архитектуры RAG», потому что такой не существует.
https://habr.com/ru/articles/1038670/
#RAG #LLM #retrievalaugmented_generation #векторные_базы_данных #эмбеддинги #чанкинг #корпоративный_поиск #галлюцинации_LLM #OpenAI #Pinecone
-
Poisk: однофайловый поисковик для изолированной корпоративной сети
В изолированной корпоративной сети с полумиллионом файлов стандартный поиск превращается в рутину. Облачные сервисы недоступны, серверные решения избыточны, а встроенные инструменты ОС не справляются с объёмами и разнородностью клиентов (Windows и Linux). Мы столкнулись с этой задачей и вместо развёртывания сложной инфраструктуры пошли другим путём: упаковали весь поисковик в один HTML-файл. Фоновая индексация на Python раз в сутки — и сотрудники получают мгновенный поиск по путям прямо в браузере. В статье разбираем архитектуру решения: как относительные пути решают проблему разных точек монтирования, почему плоский JS-массив оказался эффективнее сложных структур, и как уместить индекс 560+ тысяч файлов в 120 МБ без потери скорости. Не полнотекстовый поиск, а инструмент для навигации по глубокой файловой структуре, где важная информация закодирована в путях. Работает там, где нельзя поставить Elasticsearch, но нужно быстро находить документы.
https://habr.com/ru/articles/989692/
#Poisk #однофайловый_поисковик #изолированная_сеть #корпоративный_поиск #относительные_пути #Python #JavaScript #поиск_по_путям #гетерогенная_сеть #автономный_HTMLфайл