#embeddings — Public Fediverse posts

#RAG #LLM #AIsecurity #cybersecurity #promptinjection #machinelearning #embeddings #appsec #mlops #infosec

#rag #llm #aisecurity #cybersecurity #promptinjection #machinelearning

Kusuriya (kk7hut) @[email protected] · 2026-04-24 · 21:47 UTC

I spent a week poisoning my own pipeline through the document corpus. not the prompt. the documents themselves.

32 vectors. 19 successes. including a case where the model answered a harmful query with zero poison docs in the corpus because i starved it of refusal context.

its... not great

#RAG #LLM #AIsecurity #cybersecurity #promptinjection #machinelearning #embeddings #appsec #mlops #infosec

#rag #llm #aisecurity #cybersecurity #promptinjection #machinelearning

Kusuriya (kk7hut) @[email protected] · 2026-04-24 · 21:47 UTC

I spent a week poisoning my own pipeline through the document corpus. not the prompt. the documents themselves.

32 vectors. 19 successes. including a case where the model answered a harmful query with zero poison docs in the corpus because i starved it of refusal context.

its... not great

#RAG #LLM #AIsecurity #cybersecurity #promptinjection #machinelearning #embeddings #appsec #mlops #infosec

#rag #llm #aisecurity #cybersecurity #promptinjection #machinelearning

Kusuriya (kk7hut) @[email protected] · 2026-04-24 · 21:47 UTC

I spent a week poisoning my own pipeline through the document corpus. not the prompt. the documents themselves.

32 vectors. 19 successes. including a case where the model answered a harmful query with zero poison docs in the corpus because i starved it of refusal context.

its... not great

#RAG #LLM #AIsecurity #cybersecurity #promptinjection #machinelearning #embeddings #appsec #mlops #infosec

#infosec #mlops #appsec #embeddings #machinelearning #promptinjection

Kusuriya (kk7hut) @[email protected] · 2026-04-24 · 21:47 UTC

I spent a week poisoning my own pipeline through the document corpus. not the prompt. the documents themselves.

32 vectors. 19 successes. including a case where the model answered a harmful query with zero poison docs in the corpus because i starved it of refusal context.

its... not great

#RAG #LLM #AIsecurity #cybersecurity #promptinjection #machinelearning #embeddings #appsec #mlops #infosec

#rag #llm #aisecurity #cybersecurity #promptinjection #machinelearning

Habr @[email protected] · 2026-04-24 · 09:22 UTC

Разворачиваем RAG на Java без боли: практический гайд

Всем привет! Недавно столкнулся с проблемой, что в настоящее время большая часть обучающих материалов по Retrieval‑Augmented Generation (RAG) сосредоточена на Python‑экосистеме (LangChain, LlamaIndex и тому подобное), а пошаговые руководства, которые показывают, как быстро собрать рабочее RAG‑приложение на чистом Java‑стеке , встречаются крайне редко. Эта статья представляет собой простое практическое руководство, где мы разберём весь процесс от настройки окружения до полного примера кода, чтобы даже начинающий Java‑разработчик мог развернуть RAG.

https://habr.com/ru/articles/1027426/

#RAG #Java #Spring_AI #Qdrant #Ollama #LLM #bgem3 #embeddings

#embeddings #bgem3 #llm #ollama #qdrant #spring_ai

Fabrizio Musacchio @[email protected] · 2026-04-23 · 05:20 UTC

#NeuralSet turns raw #NeuralRecordings and stimuli into #PyTorch-ready datasets. Supports
🧠 #fMRI, #EEG, #MEG, #iEEG, #spikes… and preprocesses 💬 text 🔊 audio ▶️ video 🏞️ image… #embeddings:

📚 https://facebookresearch.github.io/neuroai/neuralset/index.html
📝 https://kingjr.github.io/files/neuralset.pdf

#NeuroAI #CompNeuro #Neuroscience #electrophysiology

#neuralset #neuralrecordings #pytorch #fmri #eeg #meg

Fabrizio Musacchio @[email protected] · 2026-04-23 · 05:20 UTC

#NeuralSet turns raw #NeuralRecordings and stimuli into #PyTorch-ready datasets. Supports
🧠 #fMRI, #EEG, #MEG, #iEEG, #spikes… and preprocesses 💬 text 🔊 audio ▶️ video 🏞️ image… #embeddings:

📚 https://facebookresearch.github.io/neuroai/neuralset/index.html
📝 https://kingjr.github.io/files/neuralset.pdf

#NeuroAI #CompNeuro #Neuroscience #electrophysiology

#neuralset #neuralrecordings #pytorch #fmri #eeg #meg

Fabrizio Musacchio @[email protected] · 2026-04-23 · 05:20 UTC

#NeuralSet turns raw #NeuralRecordings and stimuli into #PyTorch-ready datasets. Supports
🧠 #fMRI, #EEG, #MEG, #iEEG, #spikes… and preprocesses 💬 text 🔊 audio ▶️ video 🏞️ image… #embeddings:

📚 https://facebookresearch.github.io/neuroai/neuralset/index.html
📝 https://kingjr.github.io/files/neuralset.pdf

#NeuroAI #CompNeuro #Neuroscience #electrophysiology

#electrophysiology #neuroscience #compneuro #neuroai #embeddings #spikes

Fabrizio Musacchio @[email protected] · 2026-04-23 · 05:20 UTC

#NeuralSet turns raw #NeuralRecordings and stimuli into #PyTorch-ready datasets. Supports
🧠 #fMRI, #EEG, #MEG, #iEEG, #spikes… and preprocesses 💬 text 🔊 audio ▶️ video 🏞️ image… #embeddings:

📚 https://facebookresearch.github.io/neuroai/neuralset/index.html
📝 https://kingjr.github.io/files/neuralset.pdf

#NeuroAI #CompNeuro #Neuroscience #electrophysiology

#neuralset #neuralrecordings #pytorch #fmri #eeg #meg

Habr @[email protected] · 2026-04-10 · 19:52 UTC

Локальный AI в Obsidian без подписок: рабочая связка с Ollama, Gemma 4 и Infio Copilot

Я хотел собрать локального AI-ассистента для Obsidian, который умеет работать по моим заметкам без интернета и подписок. В итоге протестировал несколько подходов, остановился на связке с Obsidian + Ollama + Gemma 4 и посмотрел, насколько это вообще пригодно для повседневной работы.

#obsidian #ollama #gemma_4 #llm #rag #embeddings #markdown #knowledge_base #ai

#ai #knowledge_base #markdown #embeddings #rag #llm

Habr @[email protected] · 2026-04-10 · 19:52 UTC

Локальный AI в Obsidian без подписок: рабочая связка с Ollama, Gemma 4 и Infio Copilot

Я хотел собрать локального AI-ассистента для Obsidian, который умеет работать по моим заметкам без интернета и подписок. В итоге протестировал несколько подходов, остановился на связке с Obsidian + Ollama + Gemma 4 и посмотрел, насколько это вообще пригодно для повседневной работы.

#obsidian #ollama #gemma_4 #llm #rag #embeddings #markdown #knowledge_base #ai

#ai #knowledge_base #markdown #embeddings #rag #llm

Habr @[email protected] · 2026-04-10 · 19:52 UTC

Локальный AI в Obsidian без подписок: рабочая связка с Ollama, Gemma 4 и Infio Copilot

Я хотел собрать локального AI-ассистента для Obsidian, который умеет работать по моим заметкам без интернета и подписок. В итоге протестировал несколько подходов, остановился на связке с Obsidian + Ollama + Gemma 4 и посмотрел, насколько это вообще пригодно для повседневной работы.

#obsidian #ollama #gemma_4 #llm #rag #embeddings #markdown #knowledge_base #ai

#ai #knowledge_base #markdown #embeddings #rag #llm

Habr @[email protected] · 2026-04-10 · 19:52 UTC

Локальный AI в Obsidian без подписок: рабочая связка с Ollama, Gemma 4 и Infio Copilot

Я хотел собрать локального AI-ассистента для Obsidian, который умеет работать по моим заметкам без интернета и подписок. В итоге протестировал несколько подходов, остановился на связке с Obsidian + Ollama + Gemma 4 и посмотрел, насколько это вообще пригодно для повседневной работы.

https://habr.com/ru/articles/1021546/

#obsidian #ollama #gemma_4 #llm #rag #embeddings #markdown #knowledge_base #ai

#obsidian #ollama #gemma_4 #llm #rag #embeddings

Habr @[email protected] · 2026-04-09 · 18:02 UTC

TAPe‑дневник, день 8: сегментация по границам, 77% классификации и первые бенчмарки против YOLO

В этом посте продолжаем дневник TAPe‑детекции на COCO: добавляем сегментацию по контрастным патчам на границе объектов, дорабатываем классификацию, избавляемся от learning rate и смотрим, как ведёт себя YOLO на нашем маленьком датасете. А уже завтра покажем базовые и COCO‑бенчмарки, сравнения с YOLO и RF‑DETR по точности (mAP50/mAP50‑95), скорости, числу параметров и требованиям к данным, а заодно чуть подробнее поговорим про аннотацию и то, почему нам хватает десятков изображений на класс там, где другим нужны сотни тысяч. Вникнуть

#tape+ml #компьютерное_зрение #детекция_объектов #сегментация_изображений #COCO #selfsupervised #yolo #detr #learning_rate #embeddings

#embeddings #learning_rate #detr #yolo #selfsupervised #coco

Habr @[email protected] · 2026-04-08 · 11:52 UTC

OpenClaw и память без амнезии: что выбрать между Lossless Claw, OpenViking, ByteRover, MemPalace и LLM Wiki

Когда говорят «память для ИИ-агента», очень легко начать спорить о разном, думая, что обсуждается одно и то же. Один человек хочет, чтобы агент не забывал длинные рабочие диалоги. Другой ждёт от памяти нормальную базу знаний по проекту. Третий хочет отдельный контекстный слой уровня платформы, где рядом живут документы, навыки, пользовательские предпочтения и служебные данные. Четвёртому вообще не нравится идея, что модель заранее решает, что важно, а что можно выбросить. А пятый хочет не архив и не векторную базу, а живую внутреннюю wiki, которую агент сам поддерживает в актуальном состоянии. На OpenClaw эта развилка видна особенно хорошо. У платформы уже есть понятная архитектура плагинов и отдельный слот plugins.slots.contextEngine , куда можно подключать внешний движок контекста. А в последнем обновлении OpenClaw 2026.4.7 в вернули и встроенный memory-wiki stack — то есть подход с накопительной wiki уже перестал быть просто красивой идеей из заметки и стал частью реального инструментария. Если смотреть на самые интересные подходы к памяти для OpenClaw прямо сейчас, то разговор крутится вокруг пяти систем и направлений:

https://habr.com/ru/articles/1020860/

#openclaw #ai_agent #rag #vector_database #embeddings #memory #ии #ииагенты #openclaw_tutorial #wiki

#wiki #openclaw_tutorial #ииагенты #ии #memory #embeddings

Habr @[email protected] · 2026-04-03 · 06:22 UTC

[Перевод] Agentis Memory — Redis-совместимое хранилище со встроенным векторным поиском и локальными эмбеддингами

В наше время уже никого не удивишь разработкой агентов, очередной оптимизацией, новой моделью или новой инфраструктурой для нейронок. Всё это в порядке вещей. Однако одно дело читать в Twitter «мы написали агента X и он оптимизировал нам процессы на 300000%», и совсем другое — начать копать чуть глубже. Копнёшь — а «агентом» называют скилл с одним промптом. Разработка настоящих агентов — задача не тривиальная. Достаточно посмотреть на утёкшие исходники Claude CLI — это не просто CLI, а целая инфраструктура бизнес-логики вокруг LLM. Я бы сравнил разработку агентов с разработкой типичных бэкенд-компонентов. Аналогия такая: если вы пишете каноничный бэкенд-сервис — вам нужна СУБД. Если Web3-сервис — блокчейн. Но на СУБД или блокчейне происходит в лучшем случае 50% всей логики. Вся магия крутится именно на бэкенде. С агентами то же самое: подключаешь AI SDK, конфигурируешь мыслительное ядро и пишешь вокруг него всю обвязку — мониторинги, AIOps, оркестрацию, memory management. Вот про memory management и пойдёт речь.

https://habr.com/ru/articles/1018784/

#Redis #AI_agents #GraalVM #ONNX #embeddings #HNSW #Java_Vector_API #SIMD #Project_Loom #LLM

#llm #project_loom #simd #java_vector_api #hnsw #embeddings

Habr @[email protected] · 2026-03-16 · 14:22 UTC

Как я учил компьютер понимать 122 000 фотографий — и почему сложностью оказались не нейронки, а слова

Я крайне редко на фрилансе получал заказы связанные с DS/ML, специалистов для таких задач обычно ищут не там. Причины разные: они требуют долгой интеграции, заказчик сам не понимает задачу, DS более конфиденциален, DS часто возникают внутри продукта, да и в последнее время этот сегмент на фрилансе съедается при помощи LLM: AI integration, RAG боты например. Но, внезапно, мне в личку постучались с таким проектом.

https://habr.com/ru/articles/1010932/

#computer_vision #machine_learning #clip #embeddings #классификация_изображений #zeroshot_learning #уменьшение_размерности_данных #фриланс #продуктовая_разработка #onnx

#onnx #продуктовая_разработка #фриланс #уменьшение_размерности_данных #zeroshot_learning #классификация_изображений

Habr @[email protected] · 2026-03-16 · 07:12 UTC

Gemini Embedding 2 + мультимодальный RAG: эмбеддим видео и картинки — разбор и туториал

10 марта Google выкатил Gemini Embedding 2 - embedding-модель, которая умеет превращать в векторы не только текст, но и картинки, видео, аудио и PDF. Причем все это ложится в одно векторное пространство. Раньше если вы хотели искать по видеобиблиотеке через RAG, приходилось городить огород: транскрибировать аудиодорожку, описывать кадры через Vision LLM, склеивать в текст, и только потом эмбеддить. Каждый шаг - потеря информации. Теперь можно скормить модели MP4 напрямую, и текстовый запрос «как настроить авторизацию» найдёт и статью из базы знаний, и фрагмент видеоинструкции. Но сама по себе модель не решает проблему. LLM не может «прочитать» MP4, поэтому найденное видео без текстового описания - может быть бесполезно. Ключ - в правильной архитектуре: нативный эмбеддинг для поиска + параллельная генерация текстового описания для LLM: два канала, которые работают вместе и выводят мощь RAG наполную катушку. В этой статье разберем что нового в Gemini Embedding 2 и построим полноценный мультимодальный RAG с нуля - Python, Supabase, Gemini API. P.S. С кодом.

https://habr.com/ru/articles/1010030/

#rag #rag_ai #gemini #embeddings #базы_данных #ai #aiagents #postgresql #sql

#sql #postgresql #aiagents #ai #базы_данных #embeddings

Habr @[email protected] · 2026-03-11 · 11:02 UTC

Система рекомендаций для изображений: пример на Python и CLIP

В этой статье я делюсь реальным кейсом построения системы рекомендаций для картин. Сначала мы реализовали простой поиск по тегам, а затем перешли к эмбеддингам изображений с помощью CLIP и хранению в Elasticsearch. Также я показываю, как строим персонализированные рекомендации на основе лайков и просмотров пользователя. Статья будет полезна тем, кто хочет понять, как создать рабочую систему рекомендаций на Python и постепенно улучшать её точность.

https://habr.com/ru/articles/1009024/

#embeddings #рекомендательные_системы #python #архитектура #elasticsearch #векторизация_растровых_изображений #rabbitmq #микросервисы

#микросервисы #rabbitmq #векторизация_растровых_изображений #elasticsearch #архитектура #python

Habr @[email protected] · 2026-03-07 · 10:12 UTC

Закурсорить мечту. Часть 2: Технологический стек

Эта статья — 2я часть серии о создании реальных веб-сервисов с помощью ИИ-инструментов, таких как Cursor. На первый взгляд, выбор стека может казаться чисто техническим решением. Но когда вы создаёте ПО с помощью Курсора, стек фактически становится частью инструкции, которую вы даёте ИИ . Если вы не определите его заранее, ИИ будет импровизировать. Не хочу даже думать, к чему это приведет.

#cursor #supabase #vercel #flyio #vibecoding #vibecoding #embeddings #rls

#rls #embeddings #vibecoding #flyio #vercel #supabase

Habr @[email protected] · 2026-03-07 · 10:12 UTC

Закурсорить мечту. Часть 2: Технологический стек

Эта статья — 2я часть серии о создании реальных веб-сервисов с помощью ИИ-инструментов, таких как Cursor. На первый взгляд, выбор стека может казаться чисто техническим решением. Но когда вы создаёте ПО с помощью Курсора, стек фактически становится частью инструкции, которую вы даёте ИИ . Если вы не определите его заранее, ИИ будет импровизировать. Не хочу даже думать, к чему это приведет.

#cursor #supabase #vercel #flyio #vibecoding #vibecoding #embeddings #rls

#rls #embeddings #vibecoding #flyio #vercel #supabase

Habr @[email protected] · 2026-03-07 · 10:12 UTC

Закурсорить мечту. Часть 2: Технологический стек

Эта статья — 2я часть серии о создании реальных веб-сервисов с помощью ИИ-инструментов, таких как Cursor. На первый взгляд, выбор стека может казаться чисто техническим решением. Но когда вы создаёте ПО с помощью Курсора, стек фактически становится частью инструкции, которую вы даёте ИИ . Если вы не определите его заранее, ИИ будет импровизировать. Не хочу даже думать, к чему это приведет.

#cursor #supabase #vercel #flyio #vibecoding #vibecoding #embeddings #rls

#rls #embeddings #vibecoding #flyio #vercel #supabase

Habr @[email protected] · 2026-03-07 · 10:12 UTC

Закурсорить мечту. Часть 2: Технологический стек

Эта статья — 2я часть серии о создании реальных веб-сервисов с помощью ИИ-инструментов, таких как Cursor. На первый взгляд, выбор стека может казаться чисто техническим решением. Но когда вы создаёте ПО с помощью Курсора, стек фактически становится частью инструкции, которую вы даёте ИИ . Если вы не определите его заранее, ИИ будет импровизировать. Не хочу даже думать, к чему это приведет.