home.social

#embedding — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #embedding, aggregated by home.social.

  1. #GeminiEmbedding2 is now generally available — #Google's first natively multimodal #embedding model, mapping text, images, video, audio & documents into ONE unified space 🚀

    🧠 Built on the #Gemini architecture — no more fragmented multi-pipeline setups. One model handles all media types in a single, unified embedding space.

    🧵👇#AI #GoogleAI #MachineLearning

  2. I've got a a bunch of #embedding vectors and want to convert L2 distance into something meaningful.

    Geometry says that if randomly distributed around a 512-sphere, nearly all points should be about sqrt(2) away, so it's hopeless.

    In practice my distribution looks like:

    p10: 1.074
    p25: 1.217
    p50: 1.271
    p75: 1.311
    p90: 1.343
    p99: 1.395

    so I can work with that to make it a 100-0 score, but it seems hard to justify a priori? Who can I read about the geometry of LLM embeddings?

  3. Learn how chunking strategies impact RAG performance in 2026, including fixed-size, semantic, and hybrid approaches. Discover optimization techniques for use cases like medical research and legal analysis using tools like LangChain and embedding models.

    #RAG #chunking #semantic chunking #LangChain #embedding models

    dasroot.net/posts/2026/02/chun

  4. Learn how chunking strategies impact RAG performance in 2026, including fixed-size, semantic, and hybrid approaches. Discover optimization techniques for use cases like medical research and legal analysis using tools like LangChain and embedding models.

    #RAG #chunking #semantic chunking #LangChain #embedding models

    dasroot.net/posts/2026/02/chun

  5. Learn how chunking strategies impact RAG performance in 2026, including fixed-size, semantic, and hybrid approaches. Discover optimization techniques for use cases like medical research and legal analysis using tools like LangChain and embedding models.

    #RAG #chunking #semantic chunking #LangChain #embedding models

    dasroot.net/posts/2026/02/chun

  6. Learn how chunking strategies impact RAG performance in 2026, including fixed-size, semantic, and hybrid approaches. Discover optimization techniques for use cases like medical research and legal analysis using tools like LangChain and embedding models.

    #RAG #chunking #semantic chunking #LangChain #embedding models

    dasroot.net/posts/2026/02/chun

  7. Learn how chunking strategies impact RAG performance in 2026, including fixed-size, semantic, and hybrid approaches. Discover optimization techniques for use cases like medical research and legal analysis using tools like LangChain and embedding models.

    chunking models

    dasroot.net/posts/2026/02/chun

  8. Малоресурсный язык ломает коммерческие embedding: R@1 0,83 (LaBSE) vs 0,21 (OpenAI) на армянском EPG

    Платные модели embedding не гарантируют качество на малоресурсных языках. На задаче кроссязыкового сопоставления EPG-заголовков (EN/RU/HY) бесплатная LaBSE набирает R@1 = 0,83, а OpenAI text-embedding-3-large -- 0,21. Протестировано 19 моделей, код и данные открыты.

    habr.com/ru/articles/1008422/

    #embedding #openai #малоресурсный_язык #sentencetransformers #tokenizer #iptv #epg #benchmark #эмбеддинг

  9. If you are building an application that requires search, I recommend using Elasticsearch early on. In addition to the usual full-text search, Elasticsearch allows you to perform a hybrid search: combine the results of text and vector search.
    Of course, for small amounts of data, you can use PostgreSQL tsvector with the pgvector extension, but in the long term, Elasticsearch will provide good performance.

    #Elasticsearch #Search #tsvector #pgvector #KNN #Embedding #SentenceTransformers #AI

  10. Научил ИИ-агента помнить важное и забывать лишнее в SQLite

    Я делаю локально работающего ИИ-агента и столкнулся с тем, что стандартный подход «закинуть текст в векторную базу, достать по косинусу» для долгоживущего агента не работает: контекст замусоривается, факты конфликтуют, ничего не забывается. Вместо этого реализовал графовую когнитивную память поверх одного файла SQLite: эпизодические и семантические узлы, типизированные рёбра, именованные сущности, гибридный поиск (FTS5 + vector + graph) с Reciprocal Rank Fusion, кривую забывания Эббингауза и фоновую LLM-консолидацию. В статье — полная архитектура с кодом, SQL-схемой и формулами. Код и минимальный пример — в репозитории . Дальше long-read

    habr.com/ru/articles/1006622/

    #ai_agent #ai #ии #ииагенты #память #sqlite #vector #embedding

  11. Via #LLRX All In: #Embedding #AI in #Law School #Classroom – What is irreducibly human element in #legal #education when AI can pass the #bar #exam, generate effective lectures, provide personalized #learning & #academic support? This article by law prof Gregory M. Duhl confronts that ? head-on by documenting planning, design of a comprehensive transformation of a required doctrinal law school course for 1st yr #Contracts w AI fully embedded throughout the course design. llrx.com/2026/01/all-in-embedd

  12. Почему ваш RAG не найдёт нужные документы: математический потолок embedding-моделей

    Все говорят про embedding-модели в RAG: бенчмарки MTEB, размеры моделей, chunking-стратегии. Но никто не задаёт главный вопрос: а сколько вообще документов может найти single-vector retrieval? Google DeepMind посчитали. Оказалось, что даже 4096-мерные эмбеддинги упираются в математический потолок — есть задачи, где они физически не смогут найти нужный документ из топ-2, даже если модель идеально обучена. В статье разбирается исследование LIMIT, показаны примеры, где dense retrieval проваливается (а BM25 справляется), и объяснено, почему для production-систем нужен гибридный поиск, а не слепая вера в SOTA-эмбеддинги.

    habr.com/ru/articles/987954/

    #RAG #embedding #retrieval #machine_learning #BM25 #поиск #нейросети #векторные_базы_данных

  13. Почему ваш RAG не найдёт нужные документы: математический потолок embedding-моделей

    Все говорят про embedding-модели в RAG: бенчмарки MTEB, размеры моделей, chunking-стратегии. Но никто не задаёт главный вопрос: а сколько вообще документов может найти single-vector retrieval? Google DeepMind посчитали. Оказалось, что даже 4096-мерные эмбеддинги упираются в математический потолок — есть задачи, где они физически не смогут найти нужный документ из топ-2, даже если модель идеально обучена. В статье разбирается исследование LIMIT, показаны примеры, где dense retrieval проваливается (а BM25 справляется), и объяснено, почему для production-систем нужен гибридный поиск, а не слепая вера в SOTA-эмбеддинги.

    habr.com/ru/articles/987954/

    #RAG #embedding #retrieval #machine_learning #BM25 #поиск #нейросети #векторные_базы_данных

  14. Почему ваш RAG не найдёт нужные документы: математический потолок embedding-моделей

    Все говорят про embedding-модели в RAG: бенчмарки MTEB, размеры моделей, chunking-стратегии. Но никто не задаёт главный вопрос: а сколько вообще документов может найти single-vector retrieval? Google DeepMind посчитали. Оказалось, что даже 4096-мерные эмбеддинги упираются в математический потолок — есть задачи, где они физически не смогут найти нужный документ из топ-2, даже если модель идеально обучена. В статье разбирается исследование LIMIT, показаны примеры, где dense retrieval проваливается (а BM25 справляется), и объяснено, почему для production-систем нужен гибридный поиск, а не слепая вера в SOTA-эмбеддинги.

    habr.com/ru/articles/987954/

    #RAG #embedding #retrieval #machine_learning #BM25 #поиск #нейросети #векторные_базы_данных

  15. Почему ваш RAG не найдёт нужные документы: математический потолок embedding-моделей

    Все говорят про embedding-модели в RAG: бенчмарки MTEB, размеры моделей, chunking-стратегии. Но никто не задаёт главный вопрос: а сколько вообще документов может найти single-vector retrieval? Google DeepMind посчитали. Оказалось, что даже 4096-мерные эмбеддинги упираются в математический потолок — есть задачи, где они физически не смогут найти нужный документ из топ-2, даже если модель идеально обучена. В статье разбирается исследование LIMIT, показаны примеры, где dense retrieval проваливается (а BM25 справляется), и объяснено, почему для production-систем нужен гибридный поиск, а не слепая вера в SOTA-эмбеддинги.

    habr.com/ru/articles/987954/

    #RAG #embedding #retrieval #machine_learning #BM25 #поиск #нейросети #векторные_базы_данных

  16. Introducing Xous: the world's most exciting #microkernel for #embedding your #dreams into “medium” devices! 🤖✨ Dive into #userspace #messaging wonders, because, who needs a simple, straightforward OS anyway? 📚🧐 Funded by Europe's finest to revolutionize the way we...well, forget it ever existed. 😂💰
    xous.dev/ #Xous #tech #revolution #HackerNews #ngated

  17. Introducing Xous: the world's most exciting #microkernel for #embedding your #dreams into “medium” devices! 🤖✨ Dive into #userspace #messaging wonders, because, who needs a simple, straightforward OS anyway? 📚🧐 Funded by Europe's finest to revolutionize the way we...well, forget it ever existed. 😂💰
    xous.dev/ #Xous #tech #revolution #HackerNews #ngated

  18. Introducing Xous: the world's most exciting #microkernel for #embedding your #dreams into “medium” devices! 🤖✨ Dive into #userspace #messaging wonders, because, who needs a simple, straightforward OS anyway? 📚🧐 Funded by Europe's finest to revolutionize the way we...well, forget it ever existed. 😂💰
    xous.dev/ #Xous #tech #revolution #HackerNews #ngated

  19. Introducing Xous: the world's most exciting #microkernel for #embedding your #dreams into “medium” devices! 🤖✨ Dive into #userspace #messaging wonders, because, who needs a simple, straightforward OS anyway? 📚🧐 Funded by Europe's finest to revolutionize the way we...well, forget it ever existed. 😂💰
    xous.dev/ #Xous #tech #revolution #HackerNews #ngated

  20. FYI: Vector Search Magic: Superhero & Sporty Car Combo! #shorts: By using vector math, one can combine a DeLorean image with the text query for superhero to generate an embedding. Averaging these embeddings together then allows a search to find a superhero on top of a sporty car with cool lights. #vectormath #image #superhero #DeLorean #embedding youtube.com/shorts/RMX2A02pP90

  21. За пределами embeddings: комбинируем векторный и лексический поиск для повышения релевантности

    Привет, Хабр! В предыдущем материале мы упомянули, что при работе с текстовыми корпусами embedding-модели не всегда оптимальный инструмент. В этой публикации на примере задачи поиска релевантных документов по запросу рассмотрим ограничения такого варианта решения, разберем на практике гибридный подход и оценим его эффективность. Меня зовут Вадим Скляров, я аналитик компании MWS, и уже по традиции мы будем разбираться в технической задаче с позиции системного и бизнес-анализа: — сформулируем основные моменты, которые нужно знать и описать, прежде чем передать проект команде разработки; — рассмотрим, как быстро проверить подходы к решению.

    habr.com/ru/companies/ru_mts/a

    #векторный_поиск #гибридный_поиск #embedding #лексический_анализ #косинусное_сходство #извлечение_признаков #поиск_релевантных_документов #слияние_рангов

  22. ICYMI: Vector Search Magic: Superhero & Sporty Car Combo! #shorts: By using vector math, one can combine a DeLorean image with the text query for superhero to generate an embedding. Averaging these embeddings together then allows a search to find a superhero on top of a sporty car with cool lights. #vectormath #image #superhero #DeLorean #embedding youtube.com/shorts/RMX2A02pP90

  23. Без интернета и шпионов: как мы собрали локального голосового ассистента

    Облачные ассистенты вроде Алисы , Google Assistant и Siri давно стали привычными. Но у всех у них одни и те же слабые места: зависимость от быстрого интернета и риск утечки данных. И речь не только о персональной информации — дома нередко обсуждают темы, которые можно отнести к коммерческой или даже военной тайне. Неудивительно, что многим некомфортно говорить в присутствии микрофона, который каждое слово отправляет куда-то «в облако» (один из наших заказчиков прямо сказал: «никаких Алис в доме не будет») . На Хабре уже появлялись статьи про попытки заменить Алису на полностью локальные решения. Но почти всегда все сводилось к стандартной схеме: ESP32-микрофон → Home Assistant → intent recognition . Такая связка работает, но до действительно «умного» ассистента ей далеко. Мы пошли дальше и собрали свой голосовой ассистент, о котором расскажем в статье.

    habr.com/ru/companies/wirenboa

    #Wiren_Board #BARY #Алиса #голосовой_ассистент #распознавание_речи #vosk #Piper #Embedding #Wake_Word #умный_дом

  24. 'Variance-Aware Estimation of Kernel Mean Embedding', by Geoffrey Wolfer, Pierre Alquier.

    jmlr.org/papers/v26/23-0161.ht

    #embeddings #embedding #empirical

  25. 'Small Transformers Compute Universal Metric Embeddings', by Anastasis Kratsios, Valentin Debarnot, Ivan Dokmanić.

    jmlr.org/papers/v24/22-1246.ht

    #embeddings #embedding #dimensionality

  26. 'Small Transformers Compute Universal Metric Embeddings', by Anastasis Kratsios, Valentin Debarnot, Ivan Dokmanić.

    jmlr.org/papers/v24/22-1246.ht

    #embeddings #embedding #dimensionality

  27. 🔈Monthly release of 𝐖𝐡𝐚𝐭'𝐬 𝐧𝐞𝐰 𝐢𝐧 𝐓𝐈 𝐌𝐢𝐧𝐝𝐦𝐚𝐩 | 𝐌𝐚𝐲 2024. 🔈
    Article and tool co-authored with Oleksiy Meletskiy.
    📢 New Features:
    ➡𝐖𝐫𝐢𝐭𝐞-𝐮𝐩 𝐬𝐜𝐫𝐞𝐞𝐧𝐬𝐡𝐨𝐭
    ➡𝐕𝐢𝐫𝐮𝐬𝐓𝐨𝐭𝐚𝐥 𝐈𝐎𝐂𝐬 𝐞𝐧𝐫𝐢𝐜𝐡𝐦𝐞𝐧𝐭
    ➡𝐄𝐦𝐛𝐞𝐝𝐝𝐞𝐝 𝐌𝐈𝐓𝐑𝐄 𝐀𝐓𝐓&𝐂𝐊® 𝐍𝐚𝐯𝐢𝐠𝐚𝐭𝐨𝐫
    ➡𝐏𝐃𝐅 𝐫𝐞𝐩𝐨𝐫𝐭 𝐢𝐦𝐩𝐫𝐨𝐯𝐞𝐦𝐞𝐧𝐭𝐬

    📰𝐁𝐥𝐨𝐠: lnkd.in/dgTnd-uD

    💻 𝐀𝐩𝐩: lnkd.in/dSVdG2B4
    ⏩ 𝐆𝐢𝐭𝐇𝐮𝐛: lnkd.in/dJDSQx8Y

    𝐇𝐨𝐰 𝐭𝐨 𝐠𝐞𝐭 𝐢𝐧𝐯𝐨𝐥𝐯𝐞𝐝
    The project is open to external contributions.
    To collaborate, please check the GitHub repository: lnkd.in/dJDSQx8Y

    If you find TI Mindmap useful, please consider starring ⭐ the repository on GitHub.
    hashtag

    #timindmap #ti #mindmap hashtag#mistral #ai #mistralai #threatintelligence #llm #llmapp #openai #azureopenai #largelanguagemodel #cybersecurity #cyber #security #python #streamlit #infer #embedding #chat #ioc #mitre
    #ttp #cyberreport #report #mermaid #genai #generativeai #cyberthreatintelligence #github #prompt #promptengineering #FewShotPrompting #gpt hashtag#gpt4 #api #DataVisualization #threat #infosec #threatreport hashtag#oai #analyst #soc #cert #thumbnail #virustotal #stix #GPTo