#embeddings — Public Fediverse posts
Live and recent posts from across the Fediverse tagged #embeddings, aggregated by home.social.
-
Почему RAG — фундамент любой AI-трансформации
За последние годы большинство AI-проектов в компаниях стартуют одинаково: сначала делают чат-бота, затем добавляют агентов, автоматизируют отдельные процессы и ожидают роста эффективности. На практике такие проекты часто не дают устойчивого результата. Модель может корректно генерировать текст, демонстрации выглядят убедительно, но в реальной работе ответы оказываются нестабильными, противоречивыми и не связанными с внутренними стандартами компании. Основная причина — отсутствие единого слоя знаний. В проекте для ресторанной группы с 10+ заведениями и историей более 15 лет мы сознательно начали не с агентов и не с интерфейсов, а с построения корпоративной RAG-инфраструктуры. Этот слой стал основой всей последующей AI-архитектуры.
https://habr.com/ru/articles/1039986/
#rag #искусственный_интеллект #llm #retrieval_augmented_generation #векторная_база_данных #embeddings #корпоративные_данные #ai_automation #knowledge_base #hallucinations
-
Почему RAG — фундамент любой AI-трансформации
За последние годы большинство AI-проектов в компаниях стартуют одинаково: сначала делают чат-бота, затем добавляют агентов, автоматизируют отдельные процессы и ожидают роста эффективности. На практике такие проекты часто не дают устойчивого результата. Модель может корректно генерировать текст, демонстрации выглядят убедительно, но в реальной работе ответы оказываются нестабильными, противоречивыми и не связанными с внутренними стандартами компании. Основная причина — отсутствие единого слоя знаний. В проекте для ресторанной группы с 10+ заведениями и историей более 15 лет мы сознательно начали не с агентов и не с интерфейсов, а с построения корпоративной RAG-инфраструктуры. Этот слой стал основой всей последующей AI-архитектуры.
https://habr.com/ru/articles/1039986/
#rag #искусственный_интеллект #llm #retrieval_augmented_generation #векторная_база_данных #embeddings #корпоративные_данные #ai_automation #knowledge_base #hallucinations
-
Почему RAG — фундамент любой AI-трансформации
За последние годы большинство AI-проектов в компаниях стартуют одинаково: сначала делают чат-бота, затем добавляют агентов, автоматизируют отдельные процессы и ожидают роста эффективности. На практике такие проекты часто не дают устойчивого результата. Модель может корректно генерировать текст, демонстрации выглядят убедительно, но в реальной работе ответы оказываются нестабильными, противоречивыми и не связанными с внутренними стандартами компании. Основная причина — отсутствие единого слоя знаний. В проекте для ресторанной группы с 10+ заведениями и историей более 15 лет мы сознательно начали не с агентов и не с интерфейсов, а с построения корпоративной RAG-инфраструктуры. Этот слой стал основой всей последующей AI-архитектуры.
https://habr.com/ru/articles/1039986/
#rag #искусственный_интеллект #llm #retrieval_augmented_generation #векторная_база_данных #embeddings #корпоративные_данные #ai_automation #knowledge_base #hallucinations
-
Почему RAG — фундамент любой AI-трансформации
За последние годы большинство AI-проектов в компаниях стартуют одинаково: сначала делают чат-бота, затем добавляют агентов, автоматизируют отдельные процессы и ожидают роста эффективности. На практике такие проекты часто не дают устойчивого результата. Модель может корректно генерировать текст, демонстрации выглядят убедительно, но в реальной работе ответы оказываются нестабильными, противоречивыми и не связанными с внутренними стандартами компании. Основная причина — отсутствие единого слоя знаний. В проекте для ресторанной группы с 10+ заведениями и историей более 15 лет мы сознательно начали не с агентов и не с интерфейсов, а с построения корпоративной RAG-инфраструктуры. Этот слой стал основой всей последующей AI-архитектуры.
https://habr.com/ru/articles/1039986/
#rag #искусственный_интеллект #llm #retrieval_augmented_generation #векторная_база_данных #embeddings #корпоративные_данные #ai_automation #knowledge_base #hallucinations
-
Хакатон Samsung IT Academy Hack 2026: как студенты оптимизировали поиск в корпоративном мессенджере
Поиск — штука настолько привычная, что её редко рассматривают как отдельную инженерную задачу. На деле это связка из четырёх частей: парсинг и нормализация исходных данных, индексация, обработка пользовательского запроса и ранжирование результатов. Каждая из них живёт по своим правилам и ломается по своим причинам. Сложно представить более прикладную область, поэтому на хакатоне IT Academy Hack 2026 от IT Академии Samsung Innovation Campus в этом году, мы решили попросить студентов предложить варианты улучшения поиска по сообщениям в контуре корпоративного мессенджера. Кстати, VK Tech стал индустриальным партнером конкурса уже во второй раз — предоставил инфраструктуру для студентов, и стал одним из постановщиков задач. Меня зовут Сергей Харламов, я руковожу Исследовательской лабораторией VK Tech . В этой статье расскажу об актуальных проблемах оптимизации поиска, а также о задаче и подходах, которые можно было применить для ее решения.
https://habr.com/ru/companies/vktech/articles/1038306/
#хакатон #поиск #информационный_поиск #elasticsearch #qdrant #embeddings #векторный_поиск #ранжирование #vk_workspace #vk_tech
-
RAG в enterprise: 70-80% проблем не в модели, а в данных
Эта статья родилась из работы над
https://habr.com/ru/companies/alpinadigital/articles/1036196/
#RAG #enterprise_AI #retrieval_augmented_generation #embeddings #GraphRAG #Agentic_RAG #BM25 #chunking #LLM #AlpinaGPT
-
RAG в enterprise: 70-80% проблем не в модели, а в данных
Эта статья родилась из работы над
https://habr.com/ru/companies/alpinadigital/articles/1036196/
#RAG #enterprise_AI #retrieval_augmented_generation #embeddings #GraphRAG #Agentic_RAG #BM25 #chunking #LLM #AlpinaGPT
-
RAG в enterprise: 70-80% проблем не в модели, а в данных
Эта статья родилась из работы над
https://habr.com/ru/companies/alpinadigital/articles/1036196/
#RAG #enterprise_AI #retrieval_augmented_generation #embeddings #GraphRAG #Agentic_RAG #BM25 #chunking #LLM #AlpinaGPT
-
RAG в enterprise: 70-80% проблем не в модели, а в данных
Эта статья родилась из работы над
https://habr.com/ru/companies/alpinadigital/articles/1036196/
#RAG #enterprise_AI #retrieval_augmented_generation #embeddings #GraphRAG #Agentic_RAG #BM25 #chunking #LLM #AlpinaGPT
-
Notion + RAG + Telegram: архитектура AI-копирайтера для сети ресторанов
В таком сценарии копирайтеру недостаточно просто писать тексты. Ему нужно помнить факты о каждом заведении: часы работы, фирменные блюда, формат кухни, имена шеф-поваров, особенности интерьера, правила коммуникации, ограничения по формулировкам и стиль бренда. Если ресторанов девять, эта задача быстро перестаёт быть только творческой и превращается в задачу управления знаниями. У заказчика была именно такая проблема: сеть ресторанов по России, у каждого заведения отдельная концепция и свой стиль общения с гостями. Большая часть ресурсов уходила на ежедневную текстовую работу: описания ресторанов, переводы на разные языки, пресс-релизы, рассылки, описания блюд, мероприятий, посты для социальных сетей и тексты в Tone of Voice каждого бренда. Задача заключалась не в том, чтобы заменить редактора, а в том, чтобы вынести рутинную часть генерации текстов в AI-систему. Один-два редактора должны были управлять контентом всей сети: ставить задачи, получать черновики, проверять факты, корректировать стиль и доводить материалы до публикации.
https://habr.com/ru/articles/1035628/
#llm #rag #автоматизация #telegramбот #генерация_контента #notion_ai #embeddings #векторная_база_данных #prompt_engineering
-
Notion + RAG + Telegram: архитектура AI-копирайтера для сети ресторанов
В таком сценарии копирайтеру недостаточно просто писать тексты. Ему нужно помнить факты о каждом заведении: часы работы, фирменные блюда, формат кухни, имена шеф-поваров, особенности интерьера, правила коммуникации, ограничения по формулировкам и стиль бренда. Если ресторанов девять, эта задача быстро перестаёт быть только творческой и превращается в задачу управления знаниями. У заказчика была именно такая проблема: сеть ресторанов по России, у каждого заведения отдельная концепция и свой стиль общения с гостями. Большая часть ресурсов уходила на ежедневную текстовую работу: описания ресторанов, переводы на разные языки, пресс-релизы, рассылки, описания блюд, мероприятий, посты для социальных сетей и тексты в Tone of Voice каждого бренда. Задача заключалась не в том, чтобы заменить редактора, а в том, чтобы вынести рутинную часть генерации текстов в AI-систему. Один-два редактора должны были управлять контентом всей сети: ставить задачи, получать черновики, проверять факты, корректировать стиль и доводить материалы до публикации.
https://habr.com/ru/articles/1035628/
#llm #rag #автоматизация #telegramбот #генерация_контента #notion_ai #embeddings #векторная_база_данных #prompt_engineering
-
Notion + RAG + Telegram: архитектура AI-копирайтера для сети ресторанов
В таком сценарии копирайтеру недостаточно просто писать тексты. Ему нужно помнить факты о каждом заведении: часы работы, фирменные блюда, формат кухни, имена шеф-поваров, особенности интерьера, правила коммуникации, ограничения по формулировкам и стиль бренда. Если ресторанов девять, эта задача быстро перестаёт быть только творческой и превращается в задачу управления знаниями. У заказчика была именно такая проблема: сеть ресторанов по России, у каждого заведения отдельная концепция и свой стиль общения с гостями. Большая часть ресурсов уходила на ежедневную текстовую работу: описания ресторанов, переводы на разные языки, пресс-релизы, рассылки, описания блюд, мероприятий, посты для социальных сетей и тексты в Tone of Voice каждого бренда. Задача заключалась не в том, чтобы заменить редактора, а в том, чтобы вынести рутинную часть генерации текстов в AI-систему. Один-два редактора должны были управлять контентом всей сети: ставить задачи, получать черновики, проверять факты, корректировать стиль и доводить материалы до публикации.
https://habr.com/ru/articles/1035628/
#llm #rag #автоматизация #telegramбот #генерация_контента #notion_ai #embeddings #векторная_база_данных #prompt_engineering
-
Notion + RAG + Telegram: архитектура AI-копирайтера для сети ресторанов
В таком сценарии копирайтеру недостаточно просто писать тексты. Ему нужно помнить факты о каждом заведении: часы работы, фирменные блюда, формат кухни, имена шеф-поваров, особенности интерьера, правила коммуникации, ограничения по формулировкам и стиль бренда. Если ресторанов девять, эта задача быстро перестаёт быть только творческой и превращается в задачу управления знаниями. У заказчика была именно такая проблема: сеть ресторанов по России, у каждого заведения отдельная концепция и свой стиль общения с гостями. Большая часть ресурсов уходила на ежедневную текстовую работу: описания ресторанов, переводы на разные языки, пресс-релизы, рассылки, описания блюд, мероприятий, посты для социальных сетей и тексты в Tone of Voice каждого бренда. Задача заключалась не в том, чтобы заменить редактора, а в том, чтобы вынести рутинную часть генерации текстов в AI-систему. Один-два редактора должны были управлять контентом всей сети: ставить задачи, получать черновики, проверять факты, корректировать стиль и доводить материалы до публикации.
https://habr.com/ru/articles/1035628/
#llm #rag #автоматизация #telegramбот #генерация_контента #notion_ai #embeddings #векторная_база_данных #prompt_engineering
-
Клиент — это тоже вектор? Как мы хотели улучшить ML-модель, а построили similarity engine
Поговорим о том, как превращать последовательности пользовательских событий в векторы, зачем обучать BERT на "языке" клиентского поведения и почему embedding-пространство может неожиданно начать отражать будущую ценность пользователей
https://habr.com/ru/articles/1034880/
#машинное_обучение #анализ_данных #bert #deep_learning #machine_learning #embeddings #transformers
-
Клиент — это тоже вектор? Как мы хотели улучшить ML-модель, а построили similarity engine
Поговорим о том, как превращать последовательности пользовательских событий в векторы, зачем обучать BERT на "языке" клиентского поведения и почему embedding-пространство может неожиданно начать отражать будущую ценность пользователей
https://habr.com/ru/articles/1034880/
#машинное_обучение #анализ_данных #bert #deep_learning #machine_learning #embeddings #transformers
-
Клиент — это тоже вектор? Как мы хотели улучшить ML-модель, а построили similarity engine
Поговорим о том, как превращать последовательности пользовательских событий в векторы, зачем обучать BERT на "языке" клиентского поведения и почему embedding-пространство может неожиданно начать отражать будущую ценность пользователей
https://habr.com/ru/articles/1034880/
#машинное_обучение #анализ_данных #bert #deep_learning #machine_learning #embeddings #transformers
-
Клиент — это тоже вектор? Как мы хотели улучшить ML-модель, а построили similarity engine
Поговорим о том, как превращать последовательности пользовательских событий в векторы, зачем обучать BERT на "языке" клиентского поведения и почему embedding-пространство может неожиданно начать отражать будущую ценность пользователей
https://habr.com/ru/articles/1034880/
#машинное_обучение #анализ_данных #bert #deep_learning #machine_learning #embeddings #transformers
-
Бенчмарк 7 эмбеддингов и 4 реранкеров на корпусе судебной практики
Привет, Хабр. Это мой первый пост здесь, поэтому пара слов о себе. Я практикующий юрист, 8+ лет практики, последние годы - в производственном секторе. Веду договорную работу (поставка, подряд, услуги), сопровождаю сделки, закрываю претензионку и представляю компанию в арбитражных судах и спорах по защите прав потребителей - на стороне производителя и поставщика. К коду пришёл через вайбкодинг: захотелось автоматизировать некоторые процессы, начал ковыряться в VS Code, Trae, Cursor и Claude Code, втянулся - и теперь это параллельное хобби рядом с основной практикой. Последние несколько месяцев пилю IP Agent - телеграм-бота, который по запросу находит релевантную судебную практику и даёт прогноз по размеру компенсации в делах об интеллектуальной собственности. Работает на RAG-пайплайне. Когда строишь поиск по узкому домену, рано или поздно встаёт вопрос: какой эмбеддинг брать и нужен ли вообще реранкер. Готовых ответов под русскую судебную практику я не нашёл, поэтому собрал свой бенчмарк. В посте - что меряли, как меряли, что получилось и что в итоге поставил в бота.
https://habr.com/ru/articles/1030706/
#RAG #embeddings #эмбеддинги #реранкер #reranker #nDCG #информационный_поиск #юридический_ИИ #USER2base #бенчмарк
-
Бенчмарк 7 эмбеддингов и 4 реранкеров на корпусе судебной практики
Привет, Хабр. Это мой первый пост здесь, поэтому пара слов о себе. Я практикующий юрист, 8+ лет практики, последние годы - в производственном секторе. Веду договорную работу (поставка, подряд, услуги), сопровождаю сделки, закрываю претензионку и представляю компанию в арбитражных судах и спорах по защите прав потребителей - на стороне производителя и поставщика. К коду пришёл через вайбкодинг: захотелось автоматизировать некоторые процессы, начал ковыряться в VS Code, Trae, Cursor и Claude Code, втянулся - и теперь это параллельное хобби рядом с основной практикой. Последние несколько месяцев пилю IP Agent - телеграм-бота, который по запросу находит релевантную судебную практику и даёт прогноз по размеру компенсации в делах об интеллектуальной собственности. Работает на RAG-пайплайне. Когда строишь поиск по узкому домену, рано или поздно встаёт вопрос: какой эмбеддинг брать и нужен ли вообще реранкер. Готовых ответов под русскую судебную практику я не нашёл, поэтому собрал свой бенчмарк. В посте - что меряли, как меряли, что получилось и что в итоге поставил в бота.
https://habr.com/ru/articles/1030706/
#RAG #embeddings #эмбеддинги #реранкер #reranker #nDCG #информационный_поиск #юридический_ИИ #USER2base #бенчмарк
-
Бенчмарк 7 эмбеддингов и 4 реранкеров на корпусе судебной практики
Привет, Хабр. Это мой первый пост здесь, поэтому пара слов о себе. Я практикующий юрист, 8+ лет практики, последние годы - в производственном секторе. Веду договорную работу (поставка, подряд, услуги), сопровождаю сделки, закрываю претензионку и представляю компанию в арбитражных судах и спорах по защите прав потребителей - на стороне производителя и поставщика. К коду пришёл через вайбкодинг: захотелось автоматизировать некоторые процессы, начал ковыряться в VS Code, Trae, Cursor и Claude Code, втянулся - и теперь это параллельное хобби рядом с основной практикой. Последние несколько месяцев пилю IP Agent - телеграм-бота, который по запросу находит релевантную судебную практику и даёт прогноз по размеру компенсации в делах об интеллектуальной собственности. Работает на RAG-пайплайне. Когда строишь поиск по узкому домену, рано или поздно встаёт вопрос: какой эмбеддинг брать и нужен ли вообще реранкер. Готовых ответов под русскую судебную практику я не нашёл, поэтому собрал свой бенчмарк. В посте - что меряли, как меряли, что получилось и что в итоге поставил в бота.
https://habr.com/ru/articles/1030706/
#RAG #embeddings #эмбеддинги #реранкер #reranker #nDCG #информационный_поиск #юридический_ИИ #USER2base #бенчмарк
-
Бенчмарк 7 эмбеддингов и 4 реранкеров на корпусе судебной практики
Привет, Хабр. Это мой первый пост здесь, поэтому пара слов о себе. Я практикующий юрист, 8+ лет практики, последние годы - в производственном секторе. Веду договорную работу (поставка, подряд, услуги), сопровождаю сделки, закрываю претензионку и представляю компанию в арбитражных судах и спорах по защите прав потребителей - на стороне производителя и поставщика. К коду пришёл через вайбкодинг: захотелось автоматизировать некоторые процессы, начал ковыряться в VS Code, Trae, Cursor и Claude Code, втянулся - и теперь это параллельное хобби рядом с основной практикой. Последние несколько месяцев пилю IP Agent - телеграм-бота, который по запросу находит релевантную судебную практику и даёт прогноз по размеру компенсации в делах об интеллектуальной собственности. Работает на RAG-пайплайне. Когда строишь поиск по узкому домену, рано или поздно встаёт вопрос: какой эмбеддинг брать и нужен ли вообще реранкер. Готовых ответов под русскую судебную практику я не нашёл, поэтому собрал свой бенчмарк. В посте - что меряли, как меряли, что получилось и что в итоге поставил в бота.
https://habr.com/ru/articles/1030706/
#RAG #embeddings #эмбеддинги #реранкер #reranker #nDCG #информационный_поиск #юридический_ИИ #USER2base #бенчмарк
-
Big update to the Embeddings Playground: I've added a simple semantic search interface:
Check it out here: https://embeddings.svana.name/
-
Big update to the Embeddings Playground: I've added a simple semantic search interface:
Check it out here: https://embeddings.svana.name/
-
Big update to the Embeddings Playground: I've added a simple semantic search interface:
Check it out here: https://embeddings.svana.name/
-
Big update to the Embeddings Playground: I've added a simple semantic search interface:
Check it out here: https://embeddings.svana.name/
-
Big update to the Embeddings Playground: I've added a simple semantic search interface:
Check it out here: https://embeddings.svana.name/
-
I spent a week poisoning my own pipeline through the document corpus. not the prompt. the documents themselves.
32 vectors. 19 successes. including a case where the model answered a harmful query with zero poison docs in the corpus because i starved it of refusal context.
its... not great
https://corrupted.io/2026/04/24/Poisoned-Rags.html
#RAG #LLM #AIsecurity #cybersecurity #promptinjection #machinelearning #embeddings #appsec #mlops #infosec
-
I spent a week poisoning my own pipeline through the document corpus. not the prompt. the documents themselves.
32 vectors. 19 successes. including a case where the model answered a harmful query with zero poison docs in the corpus because i starved it of refusal context.
its... not great
https://corrupted.io/2026/04/24/Poisoned-Rags.html
#RAG #LLM #AIsecurity #cybersecurity #promptinjection #machinelearning #embeddings #appsec #mlops #infosec
-
I spent a week poisoning my own pipeline through the document corpus. not the prompt. the documents themselves.
32 vectors. 19 successes. including a case where the model answered a harmful query with zero poison docs in the corpus because i starved it of refusal context.
its... not great
https://corrupted.io/2026/04/24/Poisoned-Rags.html
#RAG #LLM #AIsecurity #cybersecurity #promptinjection #machinelearning #embeddings #appsec #mlops #infosec
-
I spent a week poisoning my own pipeline through the document corpus. not the prompt. the documents themselves.
32 vectors. 19 successes. including a case where the model answered a harmful query with zero poison docs in the corpus because i starved it of refusal context.
its... not great
https://corrupted.io/2026/04/24/Poisoned-Rags.html
#RAG #LLM #AIsecurity #cybersecurity #promptinjection #machinelearning #embeddings #appsec #mlops #infosec
-
I spent a week poisoning my own pipeline through the document corpus. not the prompt. the documents themselves.
32 vectors. 19 successes. including a case where the model answered a harmful query with zero poison docs in the corpus because i starved it of refusal context.
its... not great
https://corrupted.io/2026/04/24/Poisoned-Rags.html
#RAG #LLM #AIsecurity #cybersecurity #promptinjection #machinelearning #embeddings #appsec #mlops #infosec
-
YAKE! вместо нейросети: как мы заменили 600 МБ ONNX-реранкера на 400 строк статистики
В Yttri мы изначально использовали ONNX-реранкер bge-reranker-v2-m3 для RAG-поиска. Качество было хорошим, но цена для local-first desktop-приложения оказалась слишком высокой: около 600 МБ модели, до 1.8 ГБ RAM в пике и ощутимая нагрузка на CPU. В статье разбираю, как мы заменили тяжёлый нейросетевой реранкер на собственную реализацию YAKE! на Rust: без модели, без прогрева, без внешних сервисов и с латентностью порядка микросекунд. Показываю механику алгоритма, интеграцию в RAG, автотегирование, ограничения подхода и главный архитектурный вывод: не каждая AI-задача требует ещё одной нейросети. Иногда лучший AI-компонент - это тот, который удалось удалить.
https://habr.com/ru/articles/1027726/
#Rust #Tauri #RAG #SQLite #Localfirst #NLP #YAKE #Embeddings #Desktop
-
YAKE! вместо нейросети: как мы заменили 600 МБ ONNX-реранкера на 400 строк статистики
В Yttri мы изначально использовали ONNX-реранкер bge-reranker-v2-m3 для RAG-поиска. Качество было хорошим, но цена для local-first desktop-приложения оказалась слишком высокой: около 600 МБ модели, до 1.8 ГБ RAM в пике и ощутимая нагрузка на CPU. В статье разбираю, как мы заменили тяжёлый нейросетевой реранкер на собственную реализацию YAKE! на Rust: без модели, без прогрева, без внешних сервисов и с латентностью порядка микросекунд. Показываю механику алгоритма, интеграцию в RAG, автотегирование, ограничения подхода и главный архитектурный вывод: не каждая AI-задача требует ещё одной нейросети. Иногда лучший AI-компонент - это тот, который удалось удалить.
https://habr.com/ru/articles/1027726/
#Rust #Tauri #RAG #SQLite #Localfirst #NLP #YAKE #Embeddings #Desktop
-
YAKE! вместо нейросети: как мы заменили 600 МБ ONNX-реранкера на 400 строк статистики
В Yttri мы изначально использовали ONNX-реранкер bge-reranker-v2-m3 для RAG-поиска. Качество было хорошим, но цена для local-first desktop-приложения оказалась слишком высокой: около 600 МБ модели, до 1.8 ГБ RAM в пике и ощутимая нагрузка на CPU. В статье разбираю, как мы заменили тяжёлый нейросетевой реранкер на собственную реализацию YAKE! на Rust: без модели, без прогрева, без внешних сервисов и с латентностью порядка микросекунд. Показываю механику алгоритма, интеграцию в RAG, автотегирование, ограничения подхода и главный архитектурный вывод: не каждая AI-задача требует ещё одной нейросети. Иногда лучший AI-компонент - это тот, который удалось удалить.
https://habr.com/ru/articles/1027726/
#Rust #Tauri #RAG #SQLite #Localfirst #NLP #YAKE #Embeddings #Desktop
-
YAKE! вместо нейросети: как мы заменили 600 МБ ONNX-реранкера на 400 строк статистики
В Yttri мы изначально использовали ONNX-реранкер bge-reranker-v2-m3 для RAG-поиска. Качество было хорошим, но цена для local-first desktop-приложения оказалась слишком высокой: около 600 МБ модели, до 1.8 ГБ RAM в пике и ощутимая нагрузка на CPU. В статье разбираю, как мы заменили тяжёлый нейросетевой реранкер на собственную реализацию YAKE! на Rust: без модели, без прогрева, без внешних сервисов и с латентностью порядка микросекунд. Показываю механику алгоритма, интеграцию в RAG, автотегирование, ограничения подхода и главный архитектурный вывод: не каждая AI-задача требует ещё одной нейросети. Иногда лучший AI-компонент - это тот, который удалось удалить.
https://habr.com/ru/articles/1027726/
#Rust #Tauri #RAG #SQLite #Localfirst #NLP #YAKE #Embeddings #Desktop
-
Разворачиваем RAG на Java без боли: практический гайд
Всем привет! Недавно столкнулся с проблемой, что в настоящее время большая часть обучающих материалов по Retrieval‑Augmented Generation (RAG) сосредоточена на Python‑экосистеме (LangChain, LlamaIndex и тому подобное), а пошаговые руководства, которые показывают, как быстро собрать рабочее RAG‑приложение на чистом Java‑стеке , встречаются крайне редко. Эта статья представляет собой простое практическое руководство, где мы разберём весь процесс от настройки окружения до полного примера кода, чтобы даже начинающий Java‑разработчик мог развернуть RAG.
https://habr.com/ru/articles/1027426/
#RAG #Java #Spring_AI #Qdrant #Ollama #LLM #bgem3 #embeddings
-
Разворачиваем RAG на Java без боли: практический гайд
Всем привет! Недавно столкнулся с проблемой, что в настоящее время большая часть обучающих материалов по Retrieval‑Augmented Generation (RAG) сосредоточена на Python‑экосистеме (LangChain, LlamaIndex и тому подобное), а пошаговые руководства, которые показывают, как быстро собрать рабочее RAG‑приложение на чистом Java‑стеке , встречаются крайне редко. Эта статья представляет собой простое практическое руководство, где мы разберём весь процесс от настройки окружения до полного примера кода, чтобы даже начинающий Java‑разработчик мог развернуть RAG.
https://habr.com/ru/articles/1027426/
#RAG #Java #Spring_AI #Qdrant #Ollama #LLM #bgem3 #embeddings
-
Разворачиваем RAG на Java без боли: практический гайд
Всем привет! Недавно столкнулся с проблемой, что в настоящее время большая часть обучающих материалов по Retrieval‑Augmented Generation (RAG) сосредоточена на Python‑экосистеме (LangChain, LlamaIndex и тому подобное), а пошаговые руководства, которые показывают, как быстро собрать рабочее RAG‑приложение на чистом Java‑стеке , встречаются крайне редко. Эта статья представляет собой простое практическое руководство, где мы разберём весь процесс от настройки окружения до полного примера кода, чтобы даже начинающий Java‑разработчик мог развернуть RAG.
https://habr.com/ru/articles/1027426/
#RAG #Java #Spring_AI #Qdrant #Ollama #LLM #bgem3 #embeddings
-
Разворачиваем RAG на Java без боли: практический гайд
Всем привет! Недавно столкнулся с проблемой, что в настоящее время большая часть обучающих материалов по Retrieval‑Augmented Generation (RAG) сосредоточена на Python‑экосистеме (LangChain, LlamaIndex и тому подобное), а пошаговые руководства, которые показывают, как быстро собрать рабочее RAG‑приложение на чистом Java‑стеке , встречаются крайне редко. Эта статья представляет собой простое практическое руководство, где мы разберём весь процесс от настройки окружения до полного примера кода, чтобы даже начинающий Java‑разработчик мог развернуть RAG.
https://habr.com/ru/articles/1027426/
#RAG #Java #Spring_AI #Qdrant #Ollama #LLM #bgem3 #embeddings
-
This is a handy list for comparing the features of vector databases (holy mole there are a lot of them), including year of launch, opensource-ness, licences, and implementation language: https://superlinked.com/vector-db-comparison
-
This is a handy list for comparing the features of vector databases (holy mole there are a lot of them), including year of launch, opensource-ness, licences, and implementation language: https://superlinked.com/vector-db-comparison
-
This is a handy list for comparing the features of vector databases (holy mole there are a lot of them), including year of launch, opensource-ness, licences, and implementation language: https://superlinked.com/vector-db-comparison
-
This is a handy list for comparing the features of vector databases (holy mole there are a lot of them), including year of launch, opensource-ness, licences, and implementation language: https://superlinked.com/vector-db-comparison
-
This is a handy list for comparing the features of vector databases (holy mole there are a lot of them), including year of launch, opensource-ness, licences, and implementation language: https://superlinked.com/vector-db-comparison
-
#NeuralSet turns raw #NeuralRecordings and stimuli into #PyTorch-ready datasets. Supports
🧠 #fMRI, #EEG, #MEG, #iEEG, #spikes… and preprocesses 💬 text 🔊 audio ▶️ video 🏞️ image… #embeddings:📚 https://facebookresearch.github.io/neuroai/neuralset/index.html
📝 https://kingjr.github.io/files/neuralset.pdf -
#NeuralSet turns raw #NeuralRecordings and stimuli into #PyTorch-ready datasets. Supports
🧠 #fMRI, #EEG, #MEG, #iEEG, #spikes… and preprocesses 💬 text 🔊 audio ▶️ video 🏞️ image… #embeddings:📚 https://facebookresearch.github.io/neuroai/neuralset/index.html
📝 https://kingjr.github.io/files/neuralset.pdf -
#NeuralSet turns raw #NeuralRecordings and stimuli into #PyTorch-ready datasets. Supports
🧠 #fMRI, #EEG, #MEG, #iEEG, #spikes… and preprocesses 💬 text 🔊 audio ▶️ video 🏞️ image… #embeddings:📚 https://facebookresearch.github.io/neuroai/neuralset/index.html
📝 https://kingjr.github.io/files/neuralset.pdf -
#NeuralSet turns raw #NeuralRecordings and stimuli into #PyTorch-ready datasets. Supports
🧠 #fMRI, #EEG, #MEG, #iEEG, #spikes… and preprocesses 💬 text 🔊 audio ▶️ video 🏞️ image… #embeddings:📚 https://facebookresearch.github.io/neuroai/neuralset/index.html
📝 https://kingjr.github.io/files/neuralset.pdf -
#NeuralSet turns raw #NeuralRecordings and stimuli into #PyTorch-ready datasets. Supports
🧠 #fMRI, #EEG, #MEG, #iEEG, #spikes… and preprocesses 💬 text 🔊 audio ▶️ video 🏞️ image… #embeddings:📚 https://facebookresearch.github.io/neuroai/neuralset/index.html
📝 https://kingjr.github.io/files/neuralset.pdf -
tobi/qmd: mini cli search engine for your docs, knowledge bases, meeting notes, whatever. Tracking current sota approaches while being all local
"mini cli search engine for your docs, knowledge bases, meeting notes, whatever. Tracking current sota approaches while being all local"
https://github.com/tobi/qmd
#ai #embeddings #llms #rag #search