#ai_agents — Public Fediverse posts on home.social

Habr @[email protected] · 2026-07-24 · 18:02 UTC

Harness engineering: как за год собрать фабрику из десятка конвейеров

Агент проходит все проверки и сносит то, что трогать было нельзя. Промпт это не лечит — лечит среда вокруг модели. В ноябре я начал собирать такую среду и называл её просто фабрикой разработки. Меньше чем за год из неё выросло почти десять конвейеров, а у занятия, оказывается, есть название: harness engineering. Рассказываю, как оно росло, и показываю схему и скелет в github.

https://habr.com/ru/articles/1062822/

#harness_engineering #cursor #мультиагентные_системы #ai_agents #sdlc #ratchet #subagents #разработка_с_ии

#разработка_с_ии #subagents #ratchet #sdlc #ai_agents #мультиагентные_системы

Habr @[email protected] · 2026-07-24 · 18:02 UTC

Harness engineering: как за год собрать фабрику из десятка конвейеров

Агент проходит все проверки и сносит то, что трогать было нельзя. Промпт это не лечит — лечит среда вокруг модели. В ноябре я начал собирать такую среду и называл её просто фабрикой разработки. Меньше чем за год из неё выросло почти десять конвейеров, а у занятия, оказывается, есть название: harness engineering. Рассказываю, как оно росло, и показываю схему и скелет в github.

https://habr.com/ru/articles/1062822/

#harness_engineering #cursor #мультиагентные_системы #ai_agents #sdlc #ratchet #subagents #разработка_с_ии

#разработка_с_ии #subagents #ratchet #sdlc #ai_agents #мультиагентные_системы

Habr @[email protected] · 2026-07-24 · 18:02 UTC

Harness engineering: как за год собрать фабрику из десятка конвейеров

Агент проходит все проверки и сносит то, что трогать было нельзя. Промпт это не лечит — лечит среда вокруг модели. В ноябре я начал собирать такую среду и называл её просто фабрикой разработки. Меньше чем за год из неё выросло почти десять конвейеров, а у занятия, оказывается, есть название: harness engineering. Рассказываю, как оно росло, и показываю схему и скелет в github.

https://habr.com/ru/articles/1062822/

#harness_engineering #cursor #мультиагентные_системы #ai_agents #sdlc #ratchet #subagents #разработка_с_ии

#harness_engineering #cursor #мультиагентные_системы #ai_agents #sdlc #ratchet

Habr @[email protected] · 2026-07-07 · 20:32 UTC

Токенная диета для ИИ-агентов: Caveman, Ponytail и Headroom

ИИ-агенты упираются не только в цену модели, но и в лишний контекст: длинные ответы, раздутый код, большие логи и JSON. Разбираю Caveman, Ponytail и Headroom как три разных слоя токенной диеты для агентной разработки.

https://habr.com/ru/articles/1056748/

#ai_agents #llm #context_engineering #codex #claude_code #agentic_coding #оптимизация_токенов

#оптимизация_токенов #agentic_coding #claude_code #codex #context_engineering #llm

Habr @[email protected] · 2026-07-07 · 20:32 UTC

Токенная диета для ИИ-агентов: Caveman, Ponytail и Headroom

ИИ-агенты упираются не только в цену модели, но и в лишний контекст: длинные ответы, раздутый код, большие логи и JSON. Разбираю Caveman, Ponytail и Headroom как три разных слоя токенной диеты для агентной разработки.

https://habr.com/ru/articles/1056748/

#ai_agents #llm #context_engineering #codex #claude_code #agentic_coding #оптимизация_токенов

#оптимизация_токенов #agentic_coding #claude_code #codex #context_engineering #llm

Habr @[email protected] · 2026-07-07 · 20:32 UTC

Токенная диета для ИИ-агентов: Caveman, Ponytail и Headroom

ИИ-агенты упираются не только в цену модели, но и в лишний контекст: длинные ответы, раздутый код, большие логи и JSON. Разбираю Caveman, Ponytail и Headroom как три разных слоя токенной диеты для агентной разработки.

https://habr.com/ru/articles/1056748/

#ai_agents #llm #context_engineering #codex #claude_code #agentic_coding #оптимизация_токенов

#ai_agents #llm #context_engineering #codex #claude_code #agentic_coding

Habr @[email protected] · 2026-07-07 · 10:12 UTC

1038 баллов на Hacker News собрал пост про отказ от AI-кодинга. У меня была та же ночь, но другой вывод

9 мая пост «I’m going back to writing code by hand» набрал на Hacker News 1038 баллов и 617 комментариев. Автор семь месяцев вайб-кодил Kubernetes-дашборд с Claude, дошёл до god object на 1690 строк и бросил AI-кодинг. Я узнал в этом свою историю полугодовой давности, но вывод сделал другой.

https://habr.com/ru/articles/1056468/

#claude_code #ai_coding #vibecoding #clean_architecture #ai_agents #developer_tools #claudemd

#claudemd #developer_tools #ai_agents #clean_architecture #vibecoding #ai_coding

Habr @[email protected] · 2026-07-07 · 10:12 UTC

1038 баллов на Hacker News собрал пост про отказ от AI-кодинга. У меня была та же ночь, но другой вывод

9 мая пост «I’m going back to writing code by hand» набрал на Hacker News 1038 баллов и 617 комментариев. Автор семь месяцев вайб-кодил Kubernetes-дашборд с Claude, дошёл до god object на 1690 строк и бросил AI-кодинг. Я узнал в этом свою историю полугодовой давности, но вывод сделал другой.

https://habr.com/ru/articles/1056468/

#claude_code #ai_coding #vibecoding #clean_architecture #ai_agents #developer_tools #claudemd

#claudemd #developer_tools #ai_agents #clean_architecture #vibecoding #ai_coding

Habr @[email protected] · 2026-07-07 · 10:12 UTC

1038 баллов на Hacker News собрал пост про отказ от AI-кодинга. У меня была та же ночь, но другой вывод

9 мая пост «I’m going back to writing code by hand» набрал на Hacker News 1038 баллов и 617 комментариев. Автор семь месяцев вайб-кодил Kubernetes-дашборд с Claude, дошёл до god object на 1690 строк и бросил AI-кодинг. Я узнал в этом свою историю полугодовой давности, но вывод сделал другой.

https://habr.com/ru/articles/1056468/

#claude_code #ai_coding #vibecoding #clean_architecture #ai_agents #developer_tools #claudemd

#claude_code #ai_coding #vibecoding #clean_architecture #ai_agents #developer_tools

Habr @[email protected] · 2026-07-01 · 12:52 UTC

Как мы сократили код-ревью с двух суток до пятнадцати минут: кейс мультиагентной системы

Кейс CTO AlpinaGPT Сергея Андриянова: как из боли с код-ревью в аутсорс-команде вырос продукт Evolver, и почему мы сознательно отказались от автономных агентов в проде. В конце мая мы собирали внутреннюю мастер-встречу по AI-трансформации, и один из докладов оказался настолько содержательным, что я не могу удержаться и не пересказать его. Выступал Сергей Андриянов — наш CTO в Читать кейс

https://habr.com/ru/companies/alpinadigital/articles/1054436/

#ии #ai #LLM #Claude #Code_Review #мультиагентные_системы #ai_agents #Workflow #CTO #разработка

#разработка #cto #workflow #ai_agents #мультиагентные_системы #code_review

Habr @[email protected] · 2026-07-01 · 12:52 UTC

Как мы сократили код-ревью с двух суток до пятнадцати минут: кейс мультиагентной системы

Кейс CTO AlpinaGPT Сергея Андриянова: как из боли с код-ревью в аутсорс-команде вырос продукт Evolver, и почему мы сознательно отказались от автономных агентов в проде. В конце мая мы собирали внутреннюю мастер-встречу по AI-трансформации, и один из докладов оказался настолько содержательным, что я не могу удержаться и не пересказать его. Выступал Сергей Андриянов — наш CTO в Читать кейс

https://habr.com/ru/companies/alpinadigital/articles/1054436/

#ии #ai #LLM #Claude #Code_Review #мультиагентные_системы #ai_agents #Workflow #CTO #разработка

#разработка #cto #workflow #ai_agents #мультиагентные_системы #code_review

Habr @[email protected] · 2026-07-01 · 12:52 UTC

Как мы сократили код-ревью с двух суток до пятнадцати минут: кейс мультиагентной системы

Кейс CTO AlpinaGPT Сергея Андриянова: как из боли с код-ревью в аутсорс-команде вырос продукт Evolver, и почему мы сознательно отказались от автономных агентов в проде. В конце мая мы собирали внутреннюю мастер-встречу по AI-трансформации, и один из докладов оказался настолько содержательным, что я не могу удержаться и не пересказать его. Выступал Сергей Андриянов — наш CTO в Читать кейс

https://habr.com/ru/companies/alpinadigital/articles/1054436/

#ии #ai #LLM #Claude #Code_Review #мультиагентные_системы #ai_agents #Workflow #CTO #разработка

#ии #ai #llm #claude #code_review #мультиагентные_системы

Habr @[email protected] · 2026-06-30 · 14:42 UTC

Я больше не объясняю нейросети контекст. Вот что я сделал вместо этого…

Я попробовал собрать LLM Wiki: workflow, где нейросеть не просто отвечает на вопросы по документам, а постепенно поддерживает базу знаний. Взял Obsidian, Codex и несколько статей с Хабра, сделал ingest, query и lint, а затем посмотрел, чем такой подход отличается от обычного RAG. В статье показываю структуру vault, примеры wiki-слоя, стоимость ingest на Yandex Foundation Models и риски, которые быстро всплывают на практике.

https://habr.com/ru/companies/raft/articles/1054050/

#llm #rag #ai_agents #obsidian #prompt_engineering #yandexgpt

#yandexgpt #prompt_engineering #obsidian #ai_agents #rag #llm

Habr @[email protected] · 2026-06-30 · 14:42 UTC

Я больше не объясняю нейросети контекст. Вот что я сделал вместо этого…

Я попробовал собрать LLM Wiki: workflow, где нейросеть не просто отвечает на вопросы по документам, а постепенно поддерживает базу знаний. Взял Obsidian, Codex и несколько статей с Хабра, сделал ingest, query и lint, а затем посмотрел, чем такой подход отличается от обычного RAG. В статье показываю структуру vault, примеры wiki-слоя, стоимость ingest на Yandex Foundation Models и риски, которые быстро всплывают на практике.

https://habr.com/ru/companies/raft/articles/1054050/

#llm #rag #ai_agents #obsidian #prompt_engineering #yandexgpt

#yandexgpt #prompt_engineering #obsidian #ai_agents #rag #llm

Habr @[email protected] · 2026-06-30 · 14:42 UTC

Я больше не объясняю нейросети контекст. Вот что я сделал вместо этого…

Я попробовал собрать LLM Wiki: workflow, где нейросеть не просто отвечает на вопросы по документам, а постепенно поддерживает базу знаний. Взял Obsidian, Codex и несколько статей с Хабра, сделал ingest, query и lint, а затем посмотрел, чем такой подход отличается от обычного RAG. В статье показываю структуру vault, примеры wiki-слоя, стоимость ingest на Yandex Foundation Models и риски, которые быстро всплывают на практике.

https://habr.com/ru/companies/raft/articles/1054050/

#llm #rag #ai_agents #obsidian #prompt_engineering #yandexgpt

Habr @[email protected] · 2026-06-28 · 12:52 UTC

Как агент сам откроет дверь хакеру? Разбираю три реальных пробоя AI-агентов и почему обычный ред-тиминг их не найдёт

В 2026 году основной поверхностью атак становятся уже не сами LLM, а AI-агенты с инструментами, памятью и доступом к внешним сервисам. Я добавил в свой open-source сканер BarkingDog режим тестирования Agentic AI и проверил три популярных open-source проекта: Agno, OpenAI CS Agents Demo и LangGraph agent-service-toolkit. В результате получил три разных класса проблем: Confused Deputy (ASI03), Trust Exploitation (ASI08) и Agentic DoS (ASI06). В статье разбираю реальные пейлоады, ответы агентов, архитектурные причины этих уязвимостей.

https://habr.com/ru/articles/1052922/

#LLM #AI_Agents #Agentic_AI #Red_Teaming #OWASP_ASI #MCP #Prompt_Injection #LangGraph #Agno #BarkingDog

#barkingdog #agno #langgraph #prompt_injection #mcp #owasp_asi

Habr @[email protected] · 2026-06-28 · 12:52 UTC

Как агент сам откроет дверь хакеру? Разбираю три реальных пробоя AI-агентов и почему обычный ред-тиминг их не найдёт

В 2026 году основной поверхностью атак становятся уже не сами LLM, а AI-агенты с инструментами, памятью и доступом к внешним сервисам. Я добавил в свой open-source сканер BarkingDog режим тестирования Agentic AI и проверил три популярных open-source проекта: Agno, OpenAI CS Agents Demo и LangGraph agent-service-toolkit. В результате получил три разных класса проблем: Confused Deputy (ASI03), Trust Exploitation (ASI08) и Agentic DoS (ASI06). В статье разбираю реальные пейлоады, ответы агентов, архитектурные причины этих уязвимостей.

https://habr.com/ru/articles/1052922/

#LLM #AI_Agents #Agentic_AI #Red_Teaming #OWASP_ASI #MCP #Prompt_Injection #LangGraph #Agno #BarkingDog

#barkingdog #agno #langgraph #prompt_injection #mcp #owasp_asi

Habr @[email protected] · 2026-06-28 · 12:52 UTC

Как агент сам откроет дверь хакеру? Разбираю три реальных пробоя AI-агентов и почему обычный ред-тиминг их не найдёт

В 2026 году основной поверхностью атак становятся уже не сами LLM, а AI-агенты с инструментами, памятью и доступом к внешним сервисам. Я добавил в свой open-source сканер BarkingDog режим тестирования Agentic AI и проверил три популярных open-source проекта: Agno, OpenAI CS Agents Demo и LangGraph agent-service-toolkit. В результате получил три разных класса проблем: Confused Deputy (ASI03), Trust Exploitation (ASI08) и Agentic DoS (ASI06). В статье разбираю реальные пейлоады, ответы агентов, архитектурные причины этих уязвимостей.

https://habr.com/ru/articles/1052922/

#LLM #AI_Agents #Agentic_AI #Red_Teaming #OWASP_ASI #MCP #Prompt_Injection #LangGraph #Agno #BarkingDog

#llm #ai_agents #agentic_ai #red_teaming #owasp_asi #mcp

Habr @[email protected] · 2026-06-17 · 19:22 UTC

Deep Research для бедных поверх Codex

Обычный ответ LLM по сложной теме – часто мусор. Не потому что модель тупая. Просто за один prompt не получаешь полноты ответа. Это быстрый ответ из головы модели: красиво, складно, иногда даже убедительно. Но если нужно реально разобраться в рынке, технологии, конкурентах, вакансиях, конференциях или любом другом you name it кейсе, почти всегда нужен не ответ, а небольшое исследование.

https://habr.com/ru/articles/1048844/

#deep_research #codex #llm #api #markdown #automation #ai_agents #web_search

#web_search #ai_agents #automation #markdown #api #llm

Habr @[email protected] · 2026-06-17 · 19:22 UTC

Deep Research для бедных поверх Codex

Обычный ответ LLM по сложной теме – часто мусор. Не потому что модель тупая. Просто за один prompt не получаешь полноты ответа. Это быстрый ответ из головы модели: красиво, складно, иногда даже убедительно. Но если нужно реально разобраться в рынке, технологии, конкурентах, вакансиях, конференциях или любом другом you name it кейсе, почти всегда нужен не ответ, а небольшое исследование.

https://habr.com/ru/articles/1048844/

#deep_research #codex #llm #api #markdown #automation #ai_agents #web_search

#web_search #ai_agents #automation #markdown #api #llm

Habr @[email protected] · 2026-06-17 · 19:22 UTC

Deep Research для бедных поверх Codex

Обычный ответ LLM по сложной теме – часто мусор. Не потому что модель тупая. Просто за один prompt не получаешь полноты ответа. Это быстрый ответ из головы модели: красиво, складно, иногда даже убедительно. Но если нужно реально разобраться в рынке, технологии, конкурентах, вакансиях, конференциях или любом другом you name it кейсе, почти всегда нужен не ответ, а небольшое исследование.

https://habr.com/ru/articles/1048844/

#deep_research #codex #llm #api #markdown #automation #ai_agents #web_search

#deep_research #codex #llm #api #markdown #automation

Habr @[email protected] · 2026-06-13 · 15:22 UTC

[Перевод] Я сжёг недельный лимит Claude за 24 часа и придумал этому слово

Расскажу как было. Fable — новая модель Claude, у которой был открытый доступ. Я её ждал и заранее не тратил недельный лимит на другие модели, копил. Успел сжечь все лимиты пока её не закрыли. Получилось так что параллельно я крутил шесть разных проектов, в каждом по несколько агентов. Недельный лимит ушёл за 24 часа. Сижу, смотрю в каунтдаун до сброса и понимаю: для этого состояния нет слова. Когда лимиты сейчас уйдут в ноль и ты лихорадочно докидываешь всё что отложено, чтобы остаток не сгорел впустую. Действие есть, слова нет. Решил придумать. Lastbursting. От last + bursting. Дожигание остатка квоты на последних минутах. Слово легко забыть, поэтому захотелось его во что-то вложить. Сделал игру. И заодно стресс-тест для Fable: дал один большой промпт с описанием механики, баланса, анти-чита, бэкенда, лидерборда. Без декомпозиции, без оркестра агентов. Один промпт, одна попытка. Fable выдал работающий сайт, игру и сервер с первого раза. Я ничего не доделывал руками кроме мелкой полировки в копирайте. Это, наверно, единственная честная штука которую могу сказать про Fable: он сделал, не помог.

https://habr.com/ru/articles/1047138/

#Claude #Anthropic #lastbursting #AI_agents #fable #вайбкодинг #юмор

#юмор #вайбкодинг #fable #ai_agents #lastbursting #anthropic

Habr @[email protected] · 2026-06-13 · 15:22 UTC

[Перевод] Я сжёг недельный лимит Claude за 24 часа и придумал этому слово

Расскажу как было. Fable — новая модель Claude, у которой был открытый доступ. Я её ждал и заранее не тратил недельный лимит на другие модели, копил. Успел сжечь все лимиты пока её не закрыли. Получилось так что параллельно я крутил шесть разных проектов, в каждом по несколько агентов. Недельный лимит ушёл за 24 часа. Сижу, смотрю в каунтдаун до сброса и понимаю: для этого состояния нет слова. Когда лимиты сейчас уйдут в ноль и ты лихорадочно докидываешь всё что отложено, чтобы остаток не сгорел впустую. Действие есть, слова нет. Решил придумать. Lastbursting. От last + bursting. Дожигание остатка квоты на последних минутах. Слово легко забыть, поэтому захотелось его во что-то вложить. Сделал игру. И заодно стресс-тест для Fable: дал один большой промпт с описанием механики, баланса, анти-чита, бэкенда, лидерборда. Без декомпозиции, без оркестра агентов. Один промпт, одна попытка. Fable выдал работающий сайт, игру и сервер с первого раза. Я ничего не доделывал руками кроме мелкой полировки в копирайте. Это, наверно, единственная честная штука которую могу сказать про Fable: он сделал, не помог.

https://habr.com/ru/articles/1047138/

#Claude #Anthropic #lastbursting #AI_agents #fable #вайбкодинг #юмор

#юмор #вайбкодинг #fable #ai_agents #lastbursting #anthropic

Habr @[email protected] · 2026-06-13 · 15:22 UTC

[Перевод] Я сжёг недельный лимит Claude за 24 часа и придумал этому слово

Расскажу как было. Fable — новая модель Claude, у которой был открытый доступ. Я её ждал и заранее не тратил недельный лимит на другие модели, копил. Успел сжечь все лимиты пока её не закрыли. Получилось так что параллельно я крутил шесть разных проектов, в каждом по несколько агентов. Недельный лимит ушёл за 24 часа. Сижу, смотрю в каунтдаун до сброса и понимаю: для этого состояния нет слова. Когда лимиты сейчас уйдут в ноль и ты лихорадочно докидываешь всё что отложено, чтобы остаток не сгорел впустую. Действие есть, слова нет. Решил придумать. Lastbursting. От last + bursting. Дожигание остатка квоты на последних минутах. Слово легко забыть, поэтому захотелось его во что-то вложить. Сделал игру. И заодно стресс-тест для Fable: дал один большой промпт с описанием механики, баланса, анти-чита, бэкенда, лидерборда. Без декомпозиции, без оркестра агентов. Один промпт, одна попытка. Fable выдал работающий сайт, игру и сервер с первого раза. Я ничего не доделывал руками кроме мелкой полировки в копирайте. Это, наверно, единственная честная штука которую могу сказать про Fable: он сделал, не помог.

https://habr.com/ru/articles/1047138/

#Claude #Anthropic #lastbursting #AI_agents #fable #вайбкодинг #юмор

#claude #anthropic #lastbursting #ai_agents #fable #вайбкодинг

Habr @[email protected] · 2026-06-12 · 16:52 UTC

Почему мы спорим о памяти для AI-агентов

На днях наткнулся на статью про память для AI-агентов. Сама статья была вполне типичной: SQLite, хранение контекста, поиск по накопленным знаниям, экономия токенов. Но гораздо интереснее оказались комментарии. Под публикацией быстро возник спор, который на первый взгляд выглядел техническим. Одни утверждали:

https://habr.com/ru/articles/1046944/

#AI_Agents #Agent_Memory #LLM #Agentic_AI #Knowledge_Management #Context_Engineering #Longterm_Memory #Project_Memory #Retrieval_Systems #AI_Architecture

#ai_architecture #retrieval_systems #project_memory #longterm_memory #context_engineering #knowledge_management

Habr @[email protected] · 2026-06-12 · 16:52 UTC

Почему мы спорим о памяти для AI-агентов

На днях наткнулся на статью про память для AI-агентов. Сама статья была вполне типичной: SQLite, хранение контекста, поиск по накопленным знаниям, экономия токенов. Но гораздо интереснее оказались комментарии. Под публикацией быстро возник спор, который на первый взгляд выглядел техническим. Одни утверждали:

https://habr.com/ru/articles/1046944/

#AI_Agents #Agent_Memory #LLM #Agentic_AI #Knowledge_Management #Context_Engineering #Longterm_Memory #Project_Memory #Retrieval_Systems #AI_Architecture

#ai_architecture #retrieval_systems #project_memory #longterm_memory #context_engineering #knowledge_management

Habr @[email protected] · 2026-06-12 · 16:52 UTC

Почему мы спорим о памяти для AI-агентов

На днях наткнулся на статью про память для AI-агентов. Сама статья была вполне типичной: SQLite, хранение контекста, поиск по накопленным знаниям, экономия токенов. Но гораздо интереснее оказались комментарии. Под публикацией быстро возник спор, который на первый взгляд выглядел техническим. Одни утверждали:

https://habr.com/ru/articles/1046944/

#AI_Agents #Agent_Memory #LLM #Agentic_AI #Knowledge_Management #Context_Engineering #Longterm_Memory #Project_Memory #Retrieval_Systems #AI_Architecture

#ai_agents #agent_memory #llm #agentic_ai #knowledge_management #context_engineering

Habr @[email protected] · 2026-06-12 · 16:02 UTC

Самая опасная ошибка AI‑агента — не плохой код

За последний год вокруг AI-агентов сформировался довольно устойчивый набор ожиданий. Нам обещают всё более умные модели, всё более длинные контекстные окна, всё более автономных агентов. Создаётся впечатление, что осталось решить ещё пару технических проблем — и агент сможет самостоятельно разрабатывать сложные проекты почти без участия человека. Я тоже так думал.

https://habr.com/ru/articles/1046920/

#AI_Agents #LLM #Agentic_AI #Agent_Memory #AI_Governance #AI_Safety #Human_in_the_Loop #Context_Engineering #CapabilityBased_Security #Agent_Workflow

#agent_workflow #capabilitybased_security #context_engineering #human_in_the_loop #ai_safety #ai_governance

Habr @[email protected] · 2026-06-12 · 16:02 UTC

Самая опасная ошибка AI‑агента — не плохой код

За последний год вокруг AI-агентов сформировался довольно устойчивый набор ожиданий. Нам обещают всё более умные модели, всё более длинные контекстные окна, всё более автономных агентов. Создаётся впечатление, что осталось решить ещё пару технических проблем — и агент сможет самостоятельно разрабатывать сложные проекты почти без участия человека. Я тоже так думал.

https://habr.com/ru/articles/1046920/

#AI_Agents #LLM #Agentic_AI #Agent_Memory #AI_Governance #AI_Safety #Human_in_the_Loop #Context_Engineering #CapabilityBased_Security #Agent_Workflow

#agent_workflow #capabilitybased_security #context_engineering #human_in_the_loop #ai_safety #ai_governance

Habr @[email protected] · 2026-06-12 · 16:02 UTC

Самая опасная ошибка AI‑агента — не плохой код

За последний год вокруг AI-агентов сформировался довольно устойчивый набор ожиданий. Нам обещают всё более умные модели, всё более длинные контекстные окна, всё более автономных агентов. Создаётся впечатление, что осталось решить ещё пару технических проблем — и агент сможет самостоятельно разрабатывать сложные проекты почти без участия человека. Я тоже так думал.

https://habr.com/ru/articles/1046920/

#AI_Agents #LLM #Agentic_AI #Agent_Memory #AI_Governance #AI_Safety #Human_in_the_Loop #Context_Engineering #CapabilityBased_Security #Agent_Workflow

#ai_agents #llm #agentic_ai #agent_memory #ai_governance #ai_safety

Habr @[email protected] · 2026-06-10 · 13:02 UTC

Промпт-инъекции в реальных данных, широкие права доступа и другие способы сломать ИИ-агента

Привет, Хабр! На связи команда Jay Guard — платформы, которая помогает безопасно использовать языковые модели и ИИ-агентов. Недавно мы опубликовали статью про AI-агента для HR-процессов . В комментариях почти сразу появились вопросы про данные — куда уходят персональные данные, что из этого видит LLM, что пишется в логи (журнал событий) и как все это соотносится с требованиями ИБ, 152-ФЗ и внутренними регламентами. Хорошие вопросы, и их можно дополнить. Персональные данные — это лишь один класс рисков. У агентных систем есть и другие уязвимости, которые важно учитывать при проектировании и эксплуатации. О них и поговорим. А в конце статьи приготовили для вас практический чек-лист : можно пройтись по нему перед запуском агента и проверить, что уже закрыто, а что еще нет.

https://habr.com/ru/companies/just_ai/articles/1045967/

#ииагенты #информационная_безопасность #безопасность_данных #llm #prompt_injection #агентные_системы #защита_данных #персональные_данные #ai_agents #безопасность_llm

#безопасность_llm #ai_agents #персональные_данные #защита_данных #агентные_системы #prompt_injection

Habr @[email protected] · 2026-06-10 · 13:02 UTC

Промпт-инъекции в реальных данных, широкие права доступа и другие способы сломать ИИ-агента

Привет, Хабр! На связи команда Jay Guard — платформы, которая помогает безопасно использовать языковые модели и ИИ-агентов. Недавно мы опубликовали статью про AI-агента для HR-процессов . В комментариях почти сразу появились вопросы про данные — куда уходят персональные данные, что из этого видит LLM, что пишется в логи (журнал событий) и как все это соотносится с требованиями ИБ, 152-ФЗ и внутренними регламентами. Хорошие вопросы, и их можно дополнить. Персональные данные — это лишь один класс рисков. У агентных систем есть и другие уязвимости, которые важно учитывать при проектировании и эксплуатации. О них и поговорим. А в конце статьи приготовили для вас практический чек-лист : можно пройтись по нему перед запуском агента и проверить, что уже закрыто, а что еще нет.

https://habr.com/ru/companies/just_ai/articles/1045967/

#ииагенты #информационная_безопасность #безопасность_данных #llm #prompt_injection #агентные_системы #защита_данных #персональные_данные #ai_agents #безопасность_llm

#безопасность_llm #ai_agents #персональные_данные #защита_данных #агентные_системы #prompt_injection

Habr @[email protected] · 2026-06-10 · 13:02 UTC

Промпт-инъекции в реальных данных, широкие права доступа и другие способы сломать ИИ-агента

Привет, Хабр! На связи команда Jay Guard — платформы, которая помогает безопасно использовать языковые модели и ИИ-агентов. Недавно мы опубликовали статью про AI-агента для HR-процессов . В комментариях почти сразу появились вопросы про данные — куда уходят персональные данные, что из этого видит LLM, что пишется в логи (журнал событий) и как все это соотносится с требованиями ИБ, 152-ФЗ и внутренними регламентами. Хорошие вопросы, и их можно дополнить. Персональные данные — это лишь один класс рисков. У агентных систем есть и другие уязвимости, которые важно учитывать при проектировании и эксплуатации. О них и поговорим. А в конце статьи приготовили для вас практический чек-лист : можно пройтись по нему перед запуском агента и проверить, что уже закрыто, а что еще нет.

https://habr.com/ru/companies/just_ai/articles/1045967/

#ииагенты #информационная_безопасность #безопасность_данных #llm #prompt_injection #агентные_системы #защита_данных #персональные_данные #ai_agents #безопасность_llm

#ииагенты #информационная_безопасность #безопасность_данных #llm #prompt_injection #агентные_системы

Habr @[email protected] · 2026-06-06 · 07:12 UTC

Hermes Agent Desktop: личный опыт и пошаговая настройка под реальные задачи

Я пользуюсь Hermes Agent уже месяц. Всё это время работал через командную строку (WSL) потому что на windows версии не было, Конечно, уже это довольно ощутимое ограничение, так как Hermes не имел полный выход к файлам в Windows, за это время свыкся с терминалом запускал через hermes chat . недавно вышла версия v0.15.2, и вместе с ней десктопный установщик на Electron . Windows, macOS, Linux. Скачал , поставил, пошёл по настройкам. Оказалось, что в GUI тринадцать разделов, и каждый из них что-то решает. Ниже — гайд по тому, как можно оптимизировать настройки под себя.

https://habr.com/ru/articles/1044270/

#hermes_agent #ollama_cloud #ollama_cloud_подписка #subagents #persistent_memory #ai_agents

#ai_agents #persistent_memory #subagents #ollama_cloud_подписка #ollama_cloud #hermes_agent

Habr @[email protected] · 2026-06-06 · 07:12 UTC

Hermes Agent Desktop: личный опыт и пошаговая настройка под реальные задачи

Я пользуюсь Hermes Agent уже месяц. Всё это время работал через командную строку (WSL) потому что на windows версии не было, Конечно, уже это довольно ощутимое ограничение, так как Hermes не имел полный выход к файлам в Windows, за это время свыкся с терминалом запускал через hermes chat . недавно вышла версия v0.15.2, и вместе с ней десктопный установщик на Electron . Windows, macOS, Linux. Скачал , поставил, пошёл по настройкам. Оказалось, что в GUI тринадцать разделов, и каждый из них что-то решает. Ниже — гайд по тому, как можно оптимизировать настройки под себя.

https://habr.com/ru/articles/1044270/

#hermes_agent #ollama_cloud #ollama_cloud_подписка #subagents #persistent_memory #ai_agents

#ai_agents #persistent_memory #subagents #ollama_cloud_подписка #ollama_cloud #hermes_agent

Habr @[email protected] · 2026-06-06 · 07:12 UTC

Hermes Agent Desktop: личный опыт и пошаговая настройка под реальные задачи

Я пользуюсь Hermes Agent уже месяц. Всё это время работал через командную строку (WSL) потому что на windows версии не было, Конечно, уже это довольно ощутимое ограничение, так как Hermes не имел полный выход к файлам в Windows, за это время свыкся с терминалом запускал через hermes chat . недавно вышла версия v0.15.2, и вместе с ней десктопный установщик на Electron . Windows, macOS, Linux. Скачал , поставил, пошёл по настройкам. Оказалось, что в GUI тринадцать разделов, и каждый из них что-то решает. Ниже — гайд по тому, как можно оптимизировать настройки под себя.

https://habr.com/ru/articles/1044270/

#hermes_agent #ollama_cloud #ollama_cloud_подписка #subagents #persistent_memory #ai_agents

Habr @[email protected] · 2026-06-05 · 06:12 UTC

Как устроены LLM-агенты: архитектура, планирование и инструменты

Если вы хоть раз просили ChatGPT выполнить какую-то задачу и получали в ответ инструкцию "как это сделать" вместо того чтобы он взял и сделал сам - вы столкнулись с ограничением обычной языковой модели. Она умеет объяснять и советовать, но сама ничего не делает: не лезет в интернет, не запускает код, не сохраняет файлы. Просто отвечает. LLM-агент - это другая история. Это система, которая получает задачу и начинает её решать: ищет информацию, пишет и запускает код, вызывает API, сохраняет результаты. Она не просто говорит "вот как это можно сделать" - она берёт и делает. В этой статье разберём, как такие системы устроены изнутри: из каких компонентов состоят, как принимают решения, какие инструменты используют и где обычно ломаются.

https://habr.com/ru/articles/1043878/

#LLM #агенты #AI_agents #prompt_engineering #архитектура_ИИ #LangGraph #ChatGPT #языковые_модели

#языковые_модели #chatgpt #langgraph #архитектура_ии #prompt_engineering #ai_agents

Habr @[email protected] · 2026-06-05 · 06:12 UTC

Как устроены LLM-агенты: архитектура, планирование и инструменты

Если вы хоть раз просили ChatGPT выполнить какую-то задачу и получали в ответ инструкцию "как это сделать" вместо того чтобы он взял и сделал сам - вы столкнулись с ограничением обычной языковой модели. Она умеет объяснять и советовать, но сама ничего не делает: не лезет в интернет, не запускает код, не сохраняет файлы. Просто отвечает. LLM-агент - это другая история. Это система, которая получает задачу и начинает её решать: ищет информацию, пишет и запускает код, вызывает API, сохраняет результаты. Она не просто говорит "вот как это можно сделать" - она берёт и делает. В этой статье разберём, как такие системы устроены изнутри: из каких компонентов состоят, как принимают решения, какие инструменты используют и где обычно ломаются.

https://habr.com/ru/articles/1043878/

#LLM #агенты #AI_agents #prompt_engineering #архитектура_ИИ #LangGraph #ChatGPT #языковые_модели

#языковые_модели #chatgpt #langgraph #архитектура_ии #prompt_engineering #ai_agents

Habr @[email protected] · 2026-06-05 · 06:12 UTC

Как устроены LLM-агенты: архитектура, планирование и инструменты

Если вы хоть раз просили ChatGPT выполнить какую-то задачу и получали в ответ инструкцию "как это сделать" вместо того чтобы он взял и сделал сам - вы столкнулись с ограничением обычной языковой модели. Она умеет объяснять и советовать, но сама ничего не делает: не лезет в интернет, не запускает код, не сохраняет файлы. Просто отвечает. LLM-агент - это другая история. Это система, которая получает задачу и начинает её решать: ищет информацию, пишет и запускает код, вызывает API, сохраняет результаты. Она не просто говорит "вот как это можно сделать" - она берёт и делает. В этой статье разберём, как такие системы устроены изнутри: из каких компонентов состоят, как принимают решения, какие инструменты используют и где обычно ломаются.

https://habr.com/ru/articles/1043878/

#LLM #агенты #AI_agents #prompt_engineering #архитектура_ИИ #LangGraph #ChatGPT #языковые_модели

#llm #агенты #ai_agents #prompt_engineering #архитектура_ии #langgraph

Habr @[email protected] · 2026-06-04 · 14:02 UTC

ИИ не отменяет найм. Он просто выставляет счёт в другом месте

ИИ уже меняет разработку, поддержку, аналитику и офисную рутину. Но тезис “больше продуктивности, меньше людей” слишком удобный. На практике корпоративный ИИ часто не убирает расходы, а переносит их в токены, инфраструктуру, безопасность, интеграции, ревью, ошибки и зависимость от поставщиков.

https://habr.com/ru/articles/1043694/

#ИИ #генеративный_ИИ #внедрение_ИИ #стоимость_ИИ #AI_agents #Claude_Code #Copilot #Microsoft #ROI

#roi #microsoft #copilot #claude_code #ai_agents #стоимость_ии

Habr @[email protected] · 2026-06-04 · 14:02 UTC

ИИ не отменяет найм. Он просто выставляет счёт в другом месте

ИИ уже меняет разработку, поддержку, аналитику и офисную рутину. Но тезис “больше продуктивности, меньше людей” слишком удобный. На практике корпоративный ИИ часто не убирает расходы, а переносит их в токены, инфраструктуру, безопасность, интеграции, ревью, ошибки и зависимость от поставщиков.

https://habr.com/ru/articles/1043694/

#ИИ #генеративный_ИИ #внедрение_ИИ #стоимость_ИИ #AI_agents #Claude_Code #Copilot #Microsoft #ROI

#roi #microsoft #copilot #claude_code #ai_agents #стоимость_ии

Habr @[email protected] · 2026-06-04 · 14:02 UTC

ИИ не отменяет найм. Он просто выставляет счёт в другом месте

ИИ уже меняет разработку, поддержку, аналитику и офисную рутину. Но тезис “больше продуктивности, меньше людей” слишком удобный. На практике корпоративный ИИ часто не убирает расходы, а переносит их в токены, инфраструктуру, безопасность, интеграции, ревью, ошибки и зависимость от поставщиков.

https://habr.com/ru/articles/1043694/

#ИИ #генеративный_ИИ #внедрение_ИИ #стоимость_ИИ #AI_agents #Claude_Code #Copilot #Microsoft #ROI

#ии #генеративный_ии #внедрение_ии #стоимость_ии #ai_agents #claude_code

Habr @[email protected] · 2026-06-03 · 07:52 UTC

Почему AI-агент с доступом к API опаснее обычного ChatGPT

Небольшое уточнение перед началом. В статье будет упоминаться некий (скриптовый) язык описания политик SIL (Security Intent Language). На его месте могло бы быть любое другое название, формат или технология. В рамках материала SIL используется исключительно как пример удобного способа описания правил поведения AI-агентов. Основная цель статьи - объяснить проблему контроля действий AI и показать один из возможных подходов к её решению.

https://habr.com/ru/articles/1042998/

#AI_Agents #Agentic_AI #LLM #Tool_Calling #Prompt_Injection #AI_Security #API_Security #RBAC #Runtime_Control #Policy_Engine

#policy_engine #runtime_control #rbac #api_security #ai_security #prompt_injection

Habr @[email protected] · 2026-06-03 · 07:52 UTC

Почему AI-агент с доступом к API опаснее обычного ChatGPT

Небольшое уточнение перед началом. В статье будет упоминаться некий (скриптовый) язык описания политик SIL (Security Intent Language). На его месте могло бы быть любое другое название, формат или технология. В рамках материала SIL используется исключительно как пример удобного способа описания правил поведения AI-агентов. Основная цель статьи - объяснить проблему контроля действий AI и показать один из возможных подходов к её решению.

https://habr.com/ru/articles/1042998/

#AI_Agents #Agentic_AI #LLM #Tool_Calling #Prompt_Injection #AI_Security #API_Security #RBAC #Runtime_Control #Policy_Engine

#policy_engine #runtime_control #rbac #api_security #ai_security #prompt_injection

Habr @[email protected] · 2026-06-03 · 07:52 UTC

Почему AI-агент с доступом к API опаснее обычного ChatGPT

Небольшое уточнение перед началом. В статье будет упоминаться некий (скриптовый) язык описания политик SIL (Security Intent Language). На его месте могло бы быть любое другое название, формат или технология. В рамках материала SIL используется исключительно как пример удобного способа описания правил поведения AI-агентов. Основная цель статьи - объяснить проблему контроля действий AI и показать один из возможных подходов к её решению.

https://habr.com/ru/articles/1042998/

#AI_Agents #Agentic_AI #LLM #Tool_Calling #Prompt_Injection #AI_Security #API_Security #RBAC #Runtime_Control #Policy_Engine

#ai_agents #agentic_ai #llm #tool_calling #prompt_injection #ai_security

Habr @[email protected] · 2026-06-02 · 17:32 UTC

Hermes Agent сжигал 603M токенов за спиной — как я сократил фоновые расходы в 125 раз

На днях я заметил, что квота Ollama Cloud Pro тратится быстрее обычного. Значительно быстрее. За семь дней я сжёг 603 миллиона токенов и не понимал, куда они уходили. Я открыл логи Hermes Agent и нашёл то, о чём не знал: блок auxiliary: с двенадцатью фоновыми задачами. Сжатие контекста, извлечение из веба, vision, поиск по сессиям, подбор навыков — всё это молча запускалось при каждом моём сообщении. Каждая задача стояла на provider: auto . И поскольку у меня не было ключей для цепочки fallback, каждая молча откатывалась на kimi-k2.6 , мою основную модель на триллион параметров. Я понятия не имел, что это происходит. Пока я печатал одно сообщение, агент отправлял одиннадцать других в фоне — через ту же модель, из того же квоты, не показывая мне промпты. Только сжатие контекста срабатывало 10–20 раз за длинную сессию, каждый раз отправляя всю историю.

https://habr.com/ru/articles/1042860/

#hermes_agent #ollama_cloud #llm #token_management #kimi_k26 #ai_agents

#ai_agents #kimi_k26 #token_management #llm #ollama_cloud #hermes_agent

Habr @[email protected] · 2026-06-02 · 17:32 UTC

Hermes Agent сжигал 603M токенов за спиной — как я сократил фоновые расходы в 125 раз

На днях я заметил, что квота Ollama Cloud Pro тратится быстрее обычного. Значительно быстрее. За семь дней я сжёг 603 миллиона токенов и не понимал, куда они уходили. Я открыл логи Hermes Agent и нашёл то, о чём не знал: блок auxiliary: с двенадцатью фоновыми задачами. Сжатие контекста, извлечение из веба, vision, поиск по сессиям, подбор навыков — всё это молча запускалось при каждом моём сообщении. Каждая задача стояла на provider: auto . И поскольку у меня не было ключей для цепочки fallback, каждая молча откатывалась на kimi-k2.6 , мою основную модель на триллион параметров. Я понятия не имел, что это происходит. Пока я печатал одно сообщение, агент отправлял одиннадцать других в фоне — через ту же модель, из того же квоты, не показывая мне промпты. Только сжатие контекста срабатывало 10–20 раз за длинную сессию, каждый раз отправляя всю историю.

https://habr.com/ru/articles/1042860/

#hermes_agent #ollama_cloud #llm #token_management #kimi_k26 #ai_agents

#ai_agents #kimi_k26 #token_management #llm #ollama_cloud #hermes_agent

Habr @[email protected] · 2026-06-02 · 17:32 UTC

Hermes Agent сжигал 603M токенов за спиной — как я сократил фоновые расходы в 125 раз

На днях я заметил, что квота Ollama Cloud Pro тратится быстрее обычного. Значительно быстрее. За семь дней я сжёг 603 миллиона токенов и не понимал, куда они уходили. Я открыл логи Hermes Agent и нашёл то, о чём не знал: блок auxiliary: с двенадцатью фоновыми задачами. Сжатие контекста, извлечение из веба, vision, поиск по сессиям, подбор навыков — всё это молча запускалось при каждом моём сообщении. Каждая задача стояла на provider: auto . И поскольку у меня не было ключей для цепочки fallback, каждая молча откатывалась на kimi-k2.6 , мою основную модель на триллион параметров. Я понятия не имел, что это происходит. Пока я печатал одно сообщение, агент отправлял одиннадцать других в фоне — через ту же модель, из того же квоты, не показывая мне промпты. Только сжатие контекста срабатывало 10–20 раз за длинную сессию, каждый раз отправляя всю историю.

https://habr.com/ru/articles/1042860/

#hermes_agent #ollama_cloud #llm #token_management #kimi_k26 #ai_agents

Habr @[email protected] · 2026-06-02 · 12:02 UTC

На какую роль вы нанимаете AI?

История создания мультиагентной AI-системы, которая управляет корпоративной ИТ-инфраструктурой: следит за системами мониторинга, восстанавливает сервисы, разбирает security-алерты и понимает естественный язык. Пятница, 18:30. Соседние башни в одном бизнес-центре. Примерно на одном уровне в своих кабинетах сидят два руководителя по информационной безопасности (CISO (Chief Information Security Officer) — компании похожего масштаба, одинаковая инфраструктура, одинаковые проблемы, одинаковый бюджет на безопасность. За окном — популярный московский бар через дорогу, оттуда доносятся звуки выступления известной рок-группы. Два CISO. Одинаковые компании. Одно решение, принятое полгода назад, разведёт их в эту пятницу по разные стороны двора.

https://habr.com/ru/articles/1042670/

#AI #кибербезопасность #soc #ciso #enterprise_ai #cybersecurity #искусственный_интеллект #ai_agents

#ai_agents #искусственный_интеллект #cybersecurity #enterprise_ai #ciso #soc

Habr @[email protected] · 2026-06-02 · 12:02 UTC

На какую роль вы нанимаете AI?

История создания мультиагентной AI-системы, которая управляет корпоративной ИТ-инфраструктурой: следит за системами мониторинга, восстанавливает сервисы, разбирает security-алерты и понимает естественный язык. Пятница, 18:30. Соседние башни в одном бизнес-центре. Примерно на одном уровне в своих кабинетах сидят два руководителя по информационной безопасности (CISO (Chief Information Security Officer) — компании похожего масштаба, одинаковая инфраструктура, одинаковые проблемы, одинаковый бюджет на безопасность. За окном — популярный московский бар через дорогу, оттуда доносятся звуки выступления известной рок-группы. Два CISO. Одинаковые компании. Одно решение, принятое полгода назад, разведёт их в эту пятницу по разные стороны двора.

https://habr.com/ru/articles/1042670/

#AI #кибербезопасность #soc #ciso #enterprise_ai #cybersecurity #искусственный_интеллект #ai_agents

#ai_agents #искусственный_интеллект #cybersecurity #enterprise_ai #ciso #soc