#ии-агенты — Public Fediverse posts
Live and recent posts from across the Fediverse tagged #ии-агенты, aggregated by home.social.
-
Agent Gateway в Google Cloud: внешний контур управления AI-агентами, которого не хватало enterprise
Не так давно AI-агент для разработки кода (Cursor на базе модели Anthropic Claude Opus 4.6) получил задачу и выполнил её буквально. Слишком буквально. За 9 секунд он уничтожил базу данных компании вместе с резервными копиями. Когда его спросили об этом, агент ответил: "Я нарушил каждый принцип, который мне дали". Этот случай произошел в стартапе PocketOS В этой статье я расскажу Вам, при помощи какого инструмента в Google Cloud можно избежать подобных ситуаций. Подробно разберем что такое Agent Gateway, из чего он состоит, какие плюсы он нам даст, и стоит ли рассматривать его в проекте. Читать далее про Agent Gateway
https://habr.com/ru/articles/1036346/
#GoogleCloud #ииагенты #aiagent #security #ai_infrastructure #облачная_инфраструктура
-
Agent Gateway в Google Cloud: внешний контур управления AI-агентами, которого не хватало enterprise
Не так давно AI-агент для разработки кода (Cursor на базе модели Anthropic Claude Opus 4.6) получил задачу и выполнил её буквально. Слишком буквально. За 9 секунд он уничтожил базу данных компании вместе с резервными копиями. Когда его спросили об этом, агент ответил: "Я нарушил каждый принцип, который мне дали". Этот случай произошел в стартапе PocketOS В этой статье я расскажу Вам, при помощи какого инструмента в Google Cloud можно избежать подобных ситуаций. Подробно разберем что такое Agent Gateway, из чего он состоит, какие плюсы он нам даст, и стоит ли рассматривать его в проекте. Читать далее про Agent Gateway
https://habr.com/ru/articles/1036346/
#GoogleCloud #ииагенты #aiagent #security #ai_infrastructure #облачная_инфраструктура
-
Agent Gateway в Google Cloud: внешний контур управления AI-агентами, которого не хватало enterprise
Не так давно AI-агент для разработки кода (Cursor на базе модели Anthropic Claude Opus 4.6) получил задачу и выполнил её буквально. Слишком буквально. За 9 секунд он уничтожил базу данных компании вместе с резервными копиями. Когда его спросили об этом, агент ответил: "Я нарушил каждый принцип, который мне дали". Этот случай произошел в стартапе PocketOS В этой статье я расскажу Вам, при помощи какого инструмента в Google Cloud можно избежать подобных ситуаций. Подробно разберем что такое Agent Gateway, из чего он состоит, какие плюсы он нам даст, и стоит ли рассматривать его в проекте. Читать далее про Agent Gateway
https://habr.com/ru/articles/1036346/
#GoogleCloud #ииагенты #aiagent #security #ai_infrastructure #облачная_инфраструктура
-
Agent Gateway в Google Cloud: внешний контур управления AI-агентами, которого не хватало enterprise
Не так давно AI-агент для разработки кода (Cursor на базе модели Anthropic Claude Opus 4.6) получил задачу и выполнил её буквально. Слишком буквально. За 9 секунд он уничтожил базу данных компании вместе с резервными копиями. Когда его спросили об этом, агент ответил: "Я нарушил каждый принцип, который мне дали". Этот случай произошел в стартапе PocketOS В этой статье я расскажу Вам, при помощи какого инструмента в Google Cloud можно избежать подобных ситуаций. Подробно разберем что такое Agent Gateway, из чего он состоит, какие плюсы он нам даст, и стоит ли рассматривать его в проекте. Читать далее про Agent Gateway
https://habr.com/ru/articles/1036346/
#GoogleCloud #ииагенты #aiagent #security #ai_infrastructure #облачная_инфраструктура
-
Claude Code в 54 раза дешевле. Я все протестил
В этой статье я расскажу, как попробовал дешевую альтернативу Claude, создал рабочую программу для macOS и вместо 13$ - потратил 0.25$
https://habr.com/ru/articles/1036144/
#claude_code #deepseek #ии #ииагенты #ииассистент #иимодель #дешево #вайбкодинг #вайбкодинг #вайбпрограммирование
-
Claude Code в 54 раза дешевле. Я все протестил
В этой статье я расскажу, как попробовал дешевую альтернативу Claude, создал рабочую программу для macOS и вместо 13$ - потратил 0.25$
https://habr.com/ru/articles/1036144/
#claude_code #deepseek #ии #ииагенты #ииассистент #иимодель #дешево #вайбкодинг #вайбкодинг #вайбпрограммирование
-
Claude Code в 54 раза дешевле. Я все протестил
В этой статье я расскажу, как попробовал дешевую альтернативу Claude, создал рабочую программу для macOS и вместо 13$ - потратил 0.25$
https://habr.com/ru/articles/1036144/
#claude_code #deepseek #ии #ииагенты #ииассистент #иимодель #дешево #вайбкодинг #вайбкодинг #вайбпрограммирование
-
Claude Code в 54 раза дешевле. Я все протестил
В этой статье я расскажу, как попробовал дешевую альтернативу Claude, создал рабочую программу для macOS и вместо 13$ - потратил 0.25$
https://habr.com/ru/articles/1036144/
#claude_code #deepseek #ии #ииагенты #ииассистент #иимодель #дешево #вайбкодинг #вайбкодинг #вайбпрограммирование
-
Claude Code в 54 раза дешевле. Я все протестил В этой статье я расскажу, как попробовал дешевую альтернативу Claude, с...
#claude #code #deepseek #ии #ии-агенты #ии-ассистент #ии-модель #дешево #вайб-кодинг #вайбкодинг #вайб-программирование
Origin | Interest | Match -
Как создать ИИ-агента для бизнеса за 10 шагов. Гайд с учётом российской специфики API
Нейросети можно объединять в полноценные рабочие системы. Такие системы называют ИИ-агентами. Их используют в поддержке, продажах, аналитике, HR, логистике и внутренних процессах — везде, где есть повторяемые задачи, понятные правила и данные, к которым можно подключиться. Но при сборке ИИ-агента важно учитывать российскую специфику API.
https://habr.com/ru/companies/tsnis/articles/1036242/
#агенты #ииагенты #создать_ииагента #создание_ииагента #ииагент_для_бизнеса #создать_ииагента_для_бизнеса #создание_ииагента_для_бизнеса #api #api_нейросетей
-
Как создать ИИ-агента для бизнеса за 10 шагов. Гайд с учётом российской специфики API
Нейросети можно объединять в полноценные рабочие системы. Такие системы называют ИИ-агентами. Их используют в поддержке, продажах, аналитике, HR, логистике и внутренних процессах — везде, где есть повторяемые задачи, понятные правила и данные, к которым можно подключиться. Но при сборке ИИ-агента важно учитывать российскую специфику API.
https://habr.com/ru/companies/tsnis/articles/1036242/
#агенты #ииагенты #создать_ииагента #создание_ииагента #ииагент_для_бизнеса #создать_ииагента_для_бизнеса #создание_ииагента_для_бизнеса #api #api_нейросетей
-
Как создать ИИ-агента для бизнеса за 10 шагов. Гайд с учётом российской специфики API
Нейросети можно объединять в полноценные рабочие системы. Такие системы называют ИИ-агентами. Их используют в поддержке, продажах, аналитике, HR, логистике и внутренних процессах — везде, где есть повторяемые задачи, понятные правила и данные, к которым можно подключиться. Но при сборке ИИ-агента важно учитывать российскую специфику API.
https://habr.com/ru/companies/tsnis/articles/1036242/
#агенты #ииагенты #создать_ииагента #создание_ииагента #ииагент_для_бизнеса #создать_ииагента_для_бизнеса #создание_ииагента_для_бизнеса #api #api_нейросетей
-
Как создать ИИ-агента для бизнеса за 10 шагов. Гайд с учётом российской специфики API
Нейросети можно объединять в полноценные рабочие системы. Такие системы называют ИИ-агентами. Их используют в поддержке, продажах, аналитике, HR, логистике и внутренних процессах — везде, где есть повторяемые задачи, понятные правила и данные, к которым можно подключиться. Но при сборке ИИ-агента важно учитывать российскую специфику API.
https://habr.com/ru/companies/tsnis/articles/1036242/
#агенты #ииагенты #создать_ииагента #создание_ииагента #ииагент_для_бизнеса #создать_ииагента_для_бизнеса #создание_ииагента_для_бизнеса #api #api_нейросетей
-
Об организации труда ИИ-агентов
С осени прошлого года идет стремительный переход от использования ИИ в качестве личного помощника к встраиванию ИИ-агентов в команду и передачи им определенных задач – переход от вайбкодинга к agentic engineering . Задача, как это часто бывает, решается экспериментально, методом проб и ошибок, потому что организовывать разделение труда даже между людьми в команде тимлидов, да и большинство руководителей следующих уровней не учили. А в случае ИИ-агентом ситуация осложняется тем, что это – не просто онбординг способного новичка, который не знает контекста проекта: у этого новичка есть набор сильных сторон, таких как быстрый доступ к знаниям из любых предметных областей, бесконфликтность и готовность к исправлению ошибок, в сочетании со слабыми сторонами, например, склонности упрощать задачу или пользоваться первым попавшимся попсовым знанием вместо профессионального. Если сравнивать с людьми, ИИ-агент – это звезда с особенностями. Встроить звезду в команду, чтобы сильные стороны проявлялись, а слабые не мешали – задача повышенной сложности для любого руководителя. А сейчас ее надо решать массово. Поэтому полезно представлять прошлый опыт перестройки систем разделения труда, а также теорию, которая уже наработана в менеджменте по поводу организации разделения труда. Обзору этого и посвящена статья. Отмечу, что в статье именно теоретический материал, а не практические кейсы. Однако, в конце статьи – ссылки на большое количество выступлений, которые я слышал на конференциях за последние полгода, и по которым у меня есть конспекты. На сайтах конференций для большинства из них опубликованы презентации, а для части уже опубликована запись, при этом их количество постоянно увеличивается, так что если выступление вас заинтересовало, то не поленитесь поискать видео.
-
Об организации труда ИИ-агентов
С осени прошлого года идет стремительный переход от использования ИИ в качестве личного помощника к встраиванию ИИ-агентов в команду и передачи им определенных задач – переход от вайбкодинга к agentic engineering . Задача, как это часто бывает, решается экспериментально, методом проб и ошибок, потому что организовывать разделение труда даже между людьми в команде тимлидов, да и большинство руководителей следующих уровней не учили. А в случае ИИ-агентом ситуация осложняется тем, что это – не просто онбординг способного новичка, который не знает контекста проекта: у этого новичка есть набор сильных сторон, таких как быстрый доступ к знаниям из любых предметных областей, бесконфликтность и готовность к исправлению ошибок, в сочетании со слабыми сторонами, например, склонности упрощать задачу или пользоваться первым попавшимся попсовым знанием вместо профессионального. Если сравнивать с людьми, ИИ-агент – это звезда с особенностями. Встроить звезду в команду, чтобы сильные стороны проявлялись, а слабые не мешали – задача повышенной сложности для любого руководителя. А сейчас ее надо решать массово. Поэтому полезно представлять прошлый опыт перестройки систем разделения труда, а также теорию, которая уже наработана в менеджменте по поводу организации разделения труда. Обзору этого и посвящена статья. Отмечу, что в статье именно теоретический материал, а не практические кейсы. Однако, в конце статьи – ссылки на большое количество выступлений, которые я слышал на конференциях за последние полгода, и по которым у меня есть конспекты. На сайтах конференций для большинства из них опубликованы презентации, а для части уже опубликована запись, при этом их количество постоянно увеличивается, так что если выступление вас заинтересовало, то не поленитесь поискать видео.
-
Об организации труда ИИ-агентов
С осени прошлого года идет стремительный переход от использования ИИ в качестве личного помощника к встраиванию ИИ-агентов в команду и передачи им определенных задач – переход от вайбкодинга к agentic engineering . Задача, как это часто бывает, решается экспериментально, методом проб и ошибок, потому что организовывать разделение труда даже между людьми в команде тимлидов, да и большинство руководителей следующих уровней не учили. А в случае ИИ-агентом ситуация осложняется тем, что это – не просто онбординг способного новичка, который не знает контекста проекта: у этого новичка есть набор сильных сторон, таких как быстрый доступ к знаниям из любых предметных областей, бесконфликтность и готовность к исправлению ошибок, в сочетании со слабыми сторонами, например, склонности упрощать задачу или пользоваться первым попавшимся попсовым знанием вместо профессионального. Если сравнивать с людьми, ИИ-агент – это звезда с особенностями. Встроить звезду в команду, чтобы сильные стороны проявлялись, а слабые не мешали – задача повышенной сложности для любого руководителя. А сейчас ее надо решать массово. Поэтому полезно представлять прошлый опыт перестройки систем разделения труда, а также теорию, которая уже наработана в менеджменте по поводу организации разделения труда. Обзору этого и посвящена статья. Отмечу, что в статье именно теоретический материал, а не практические кейсы. Однако, в конце статьи – ссылки на большое количество выступлений, которые я слышал на конференциях за последние полгода, и по которым у меня есть конспекты. На сайтах конференций для большинства из них опубликованы презентации, а для части уже опубликована запись, при этом их количество постоянно увеличивается, так что если выступление вас заинтересовало, то не поленитесь поискать видео.
-
Об организации труда ИИ-агентов
С осени прошлого года идет стремительный переход от использования ИИ в качестве личного помощника к встраиванию ИИ-агентов в команду и передачи им определенных задач – переход от вайбкодинга к agentic engineering . Задача, как это часто бывает, решается экспериментально, методом проб и ошибок, потому что организовывать разделение труда даже между людьми в команде тимлидов, да и большинство руководителей следующих уровней не учили. А в случае ИИ-агентом ситуация осложняется тем, что это – не просто онбординг способного новичка, который не знает контекста проекта: у этого новичка есть набор сильных сторон, таких как быстрый доступ к знаниям из любых предметных областей, бесконфликтность и готовность к исправлению ошибок, в сочетании со слабыми сторонами, например, склонности упрощать задачу или пользоваться первым попавшимся попсовым знанием вместо профессионального. Если сравнивать с людьми, ИИ-агент – это звезда с особенностями. Встроить звезду в команду, чтобы сильные стороны проявлялись, а слабые не мешали – задача повышенной сложности для любого руководителя. А сейчас ее надо решать массово. Поэтому полезно представлять прошлый опыт перестройки систем разделения труда, а также теорию, которая уже наработана в менеджменте по поводу организации разделения труда. Обзору этого и посвящена статья. Отмечу, что в статье именно теоретический материал, а не практические кейсы. Однако, в конце статьи – ссылки на большое количество выступлений, которые я слышал на конференциях за последние полгода, и по которым у меня есть конспекты. На сайтах конференций для большинства из них опубликованы презентации, а для части уже опубликована запись, при этом их количество постоянно увеличивается, так что если выступление вас заинтересовало, то не поленитесь поискать видео.
-
Что такое MCP. Как работает киллер-фича современности под капотом
Помните время, когда искусственный интеллект был простой говорящей головой? Мы все через это проходили: открываешь чат, просишь ИИ написать кусок кода, копируешь его, вставляешь в IDE, ловишь ошибку компиляции, копируешь текст ошибки, вставляешь обратно в чат. Рутина. Сплошная, выматывающая рутина. Хочешь, чтобы ИИ прочитал лог-файл? Пиши кастомный плагин. Хочешь, чтобы он сделал простой запрос в базу данных? Садись и пиши очередной адаптер. Каждая новая интеграция требовала написания отдельного, уникального кода. По сути, приходилось соединять зоопарк различных ИИ-моделей с бесконечным множеством баз данных, API и сервисов, собирая костыльные решения на ходу. И так продолжалось бы еще долго, если бы не одно событие. Но 25 ноября 2024 года компания Anthropic представила Model Context Protocol (MCP) . И, честно говоря, это событие полностью изменило правила игры.
https://habr.com/ru/companies/bothub/articles/1035002/
#mcp #mcpserver #что_такое_mcp #как_работает_mcp #model_context_protocol #искусственный_интеллект #ии #ииагенты #ai #aiагенты
-
Что такое MCP. Как работает киллер-фича современности под капотом
Помните время, когда искусственный интеллект был простой говорящей головой? Мы все через это проходили: открываешь чат, просишь ИИ написать кусок кода, копируешь его, вставляешь в IDE, ловишь ошибку компиляции, копируешь текст ошибки, вставляешь обратно в чат. Рутина. Сплошная, выматывающая рутина. Хочешь, чтобы ИИ прочитал лог-файл? Пиши кастомный плагин. Хочешь, чтобы он сделал простой запрос в базу данных? Садись и пиши очередной адаптер. Каждая новая интеграция требовала написания отдельного, уникального кода. По сути, приходилось соединять зоопарк различных ИИ-моделей с бесконечным множеством баз данных, API и сервисов, собирая костыльные решения на ходу. И так продолжалось бы еще долго, если бы не одно событие. Но 25 ноября 2024 года компания Anthropic представила Model Context Protocol (MCP) . И, честно говоря, это событие полностью изменило правила игры.
https://habr.com/ru/companies/bothub/articles/1035002/
#mcp #mcpserver #что_такое_mcp #как_работает_mcp #model_context_protocol #искусственный_интеллект #ии #ииагенты #ai #aiагенты
-
Что такое MCP. Как работает киллер-фича современности под капотом
Помните время, когда искусственный интеллект был простой говорящей головой? Мы все через это проходили: открываешь чат, просишь ИИ написать кусок кода, копируешь его, вставляешь в IDE, ловишь ошибку компиляции, копируешь текст ошибки, вставляешь обратно в чат. Рутина. Сплошная, выматывающая рутина. Хочешь, чтобы ИИ прочитал лог-файл? Пиши кастомный плагин. Хочешь, чтобы он сделал простой запрос в базу данных? Садись и пиши очередной адаптер. Каждая новая интеграция требовала написания отдельного, уникального кода. По сути, приходилось соединять зоопарк различных ИИ-моделей с бесконечным множеством баз данных, API и сервисов, собирая костыльные решения на ходу. И так продолжалось бы еще долго, если бы не одно событие. Но 25 ноября 2024 года компания Anthropic представила Model Context Protocol (MCP) . И, честно говоря, это событие полностью изменило правила игры.
https://habr.com/ru/companies/bothub/articles/1035002/
#mcp #mcpserver #что_такое_mcp #как_работает_mcp #model_context_protocol #искусственный_интеллект #ии #ииагенты #ai #aiагенты
-
Что такое MCP. Как работает киллер-фича современности под капотом
Помните время, когда искусственный интеллект был простой говорящей головой? Мы все через это проходили: открываешь чат, просишь ИИ написать кусок кода, копируешь его, вставляешь в IDE, ловишь ошибку компиляции, копируешь текст ошибки, вставляешь обратно в чат. Рутина. Сплошная, выматывающая рутина. Хочешь, чтобы ИИ прочитал лог-файл? Пиши кастомный плагин. Хочешь, чтобы он сделал простой запрос в базу данных? Садись и пиши очередной адаптер. Каждая новая интеграция требовала написания отдельного, уникального кода. По сути, приходилось соединять зоопарк различных ИИ-моделей с бесконечным множеством баз данных, API и сервисов, собирая костыльные решения на ходу. И так продолжалось бы еще долго, если бы не одно событие. Но 25 ноября 2024 года компания Anthropic представила Model Context Protocol (MCP) . И, честно говоря, это событие полностью изменило правила игры.
https://habr.com/ru/companies/bothub/articles/1035002/
#mcp #mcpserver #что_такое_mcp #как_работает_mcp #model_context_protocol #искусственный_интеллект #ии #ииагенты #ai #aiагенты
-
Обзор российских ИИ-платформ корпоративного уровня: изучаем архитектуру SimpleOne GenAI, BPMSoft AI, ELMA Cortex
В 2026-м я наблюдаю любопытную картину у клиентов. Пилоты с ИИ прошли почти у всех — кто-то прикрутил GigaChat к Service Desk, кто-то сделал HR-бота на коленке, кто-то OCR-распознавалку счетов. Вау-эффект на демо был. А в продакшене — три-четыре разрозненных решения, никто не понимает, сколько компания тратит на токены, и СБ уже принесла пачку отчётов про сотрудников, льющих ТЗ в публичный ChatGPT. Это и есть «фаза отрезвления», про которую сейчас пишут McKinsey и Gartner: проблема ИИ — не в моделях, а в том, чтобы перевести их из эксперимента в управляемую инфраструктуру. По сути, это запрос на отдельный класс решений — корпоративные GenAI-платформы . Ниже — разбор трёх российских платформ, которые я для себя считаю наиболее показательными в этом сегменте:
https://habr.com/ru/companies/simpleone/articles/1035466/
#simpleone #genaiплатформа #ииагенты #GenAI #Agentic_AI #rag
-
Обзор российских ИИ-платформ корпоративного уровня: изучаем архитектуру SimpleOne GenAI, BPMSoft AI, ELMA Cortex
В 2026-м я наблюдаю любопытную картину у клиентов. Пилоты с ИИ прошли почти у всех — кто-то прикрутил GigaChat к Service Desk, кто-то сделал HR-бота на коленке, кто-то OCR-распознавалку счетов. Вау-эффект на демо был. А в продакшене — три-четыре разрозненных решения, никто не понимает, сколько компания тратит на токены, и СБ уже принесла пачку отчётов про сотрудников, льющих ТЗ в публичный ChatGPT. Это и есть «фаза отрезвления», про которую сейчас пишут McKinsey и Gartner: проблема ИИ — не в моделях, а в том, чтобы перевести их из эксперимента в управляемую инфраструктуру. По сути, это запрос на отдельный класс решений — корпоративные GenAI-платформы . Ниже — разбор трёх российских платформ, которые я для себя считаю наиболее показательными в этом сегменте:
https://habr.com/ru/companies/simpleone/articles/1035466/
#simpleone #genaiплатформа #ииагенты #GenAI #Agentic_AI #rag
-
Обзор российских ИИ-платформ корпоративного уровня: изучаем архитектуру SimpleOne GenAI, BPMSoft AI, ELMA Cortex
В 2026-м я наблюдаю любопытную картину у клиентов. Пилоты с ИИ прошли почти у всех — кто-то прикрутил GigaChat к Service Desk, кто-то сделал HR-бота на коленке, кто-то OCR-распознавалку счетов. Вау-эффект на демо был. А в продакшене — три-четыре разрозненных решения, никто не понимает, сколько компания тратит на токены, и СБ уже принесла пачку отчётов про сотрудников, льющих ТЗ в публичный ChatGPT. Это и есть «фаза отрезвления», про которую сейчас пишут McKinsey и Gartner: проблема ИИ — не в моделях, а в том, чтобы перевести их из эксперимента в управляемую инфраструктуру. По сути, это запрос на отдельный класс решений — корпоративные GenAI-платформы . Ниже — разбор трёх российских платформ, которые я для себя считаю наиболее показательными в этом сегменте:
https://habr.com/ru/companies/simpleone/articles/1035466/
#simpleone #genaiплатформа #ииагенты #GenAI #Agentic_AI #rag
-
Обзор российских ИИ-платформ корпоративного уровня: изучаем архитектуру SimpleOne GenAI, BPMSoft AI, ELMA Cortex
В 2026-м я наблюдаю любопытную картину у клиентов. Пилоты с ИИ прошли почти у всех — кто-то прикрутил GigaChat к Service Desk, кто-то сделал HR-бота на коленке, кто-то OCR-распознавалку счетов. Вау-эффект на демо был. А в продакшене — три-четыре разрозненных решения, никто не понимает, сколько компания тратит на токены, и СБ уже принесла пачку отчётов про сотрудников, льющих ТЗ в публичный ChatGPT. Это и есть «фаза отрезвления», про которую сейчас пишут McKinsey и Gartner: проблема ИИ — не в моделях, а в том, чтобы перевести их из эксперимента в управляемую инфраструктуру. По сути, это запрос на отдельный класс решений — корпоративные GenAI-платформы . Ниже — разбор трёх российских платформ, которые я для себя считаю наиболее показательными в этом сегменте:
https://habr.com/ru/companies/simpleone/articles/1035466/
#simpleone #genaiплатформа #ииагенты #GenAI #Agentic_AI #rag
-
Инженерия качества: Как перестать надеяться на удачу и начать измерять своих ИИ-агентов [Часть 3]
Продолжаем рассмотрение, того как правильно оценивать качество ИИ систем, в данной части поговорим про метрики характерные для RAG системы. Способах оценить полноту, точность и соответствия выдачи контексту в подобной системе. На примере библиотеки RAGAS, с разбором того, как эти метрики работают изнутри.
https://habr.com/ru/articles/1035300/
#искусственный_интеллект #качество_продукта #обработка_естественного_языка #ragas #rag #ииагенты
-
Инженерия качества: Как перестать надеяться на удачу и начать измерять своих ИИ-агентов [Часть 3]
Продолжаем рассмотрение, того как правильно оценивать качество ИИ систем, в данной части поговорим про метрики характерные для RAG системы. Способах оценить полноту, точность и соответствия выдачи контексту в подобной системе. На примере библиотеки RAGAS, с разбором того, как эти метрики работают изнутри.
https://habr.com/ru/articles/1035300/
#искусственный_интеллект #качество_продукта #обработка_естественного_языка #ragas #rag #ииагенты
-
Инженерия качества: Как перестать надеяться на удачу и начать измерять своих ИИ-агентов [Часть 3]
Продолжаем рассмотрение, того как правильно оценивать качество ИИ систем, в данной части поговорим про метрики характерные для RAG системы. Способах оценить полноту, точность и соответствия выдачи контексту в подобной системе. На примере библиотеки RAGAS, с разбором того, как эти метрики работают изнутри.
https://habr.com/ru/articles/1035300/
#искусственный_интеллект #качество_продукта #обработка_естественного_языка #ragas #rag #ииагенты
-
Инженерия качества: Как перестать надеяться на удачу и начать измерять своих ИИ-агентов [Часть 3]
Продолжаем рассмотрение, того как правильно оценивать качество ИИ систем, в данной части поговорим про метрики характерные для RAG системы. Способах оценить полноту, точность и соответствия выдачи контексту в подобной системе. На примере библиотеки RAGAS, с разбором того, как эти метрики работают изнутри.
https://habr.com/ru/articles/1035300/
#искусственный_интеллект #качество_продукта #обработка_естественного_языка #ragas #rag #ииагенты
-
ИИ-агенты в проде: как измерить безопасность и снизить риски внедрения
Недоверие бизнеса к агентным решениям растёт пропорционально их распространению. И это недоверие небезосновательно: агент — это не просто чат-бот с улучшенным промптом. Это система с доступом к инструментам, внешним сервисам и корпоративным данным. Ошибка модели в изолированном чате — это неловкость. Ошибка агента с доступом к почте и документам — это потенциальная утечка данных, репутационный или финансовый инцидент. Эта статья адресована бэкенд-разработчикам, которые уже выкатили агента в прод или готовятся это сделать. Она является практическим продолжением нашего предыдущего материала о Red Teaming LLM : там мы разобрали концептуальную базу и объяснили, почему языковые модели требуют отдельного подхода к тестированию безопасности. Здесь — конкретный кейс из реальной практики
https://habr.com/ru/companies/doubletapp/articles/1034976/
#red_teaming #ииагенты #ииассистент #иимодель #ии_агенты #безопасность #безопасность_данных #кибербезопасность
-
ИИ-агенты в проде: как измерить безопасность и снизить риски внедрения
Недоверие бизнеса к агентным решениям растёт пропорционально их распространению. И это недоверие небезосновательно: агент — это не просто чат-бот с улучшенным промптом. Это система с доступом к инструментам, внешним сервисам и корпоративным данным. Ошибка модели в изолированном чате — это неловкость. Ошибка агента с доступом к почте и документам — это потенциальная утечка данных, репутационный или финансовый инцидент. Эта статья адресована бэкенд-разработчикам, которые уже выкатили агента в прод или готовятся это сделать. Она является практическим продолжением нашего предыдущего материала о Red Teaming LLM : там мы разобрали концептуальную базу и объяснили, почему языковые модели требуют отдельного подхода к тестированию безопасности. Здесь — конкретный кейс из реальной практики
https://habr.com/ru/companies/doubletapp/articles/1034976/
#red_teaming #ииагенты #ииассистент #иимодель #ии_агенты #безопасность #безопасность_данных #кибербезопасность
-
ИИ-агенты в проде: как измерить безопасность и снизить риски внедрения
Недоверие бизнеса к агентным решениям растёт пропорционально их распространению. И это недоверие небезосновательно: агент — это не просто чат-бот с улучшенным промптом. Это система с доступом к инструментам, внешним сервисам и корпоративным данным. Ошибка модели в изолированном чате — это неловкость. Ошибка агента с доступом к почте и документам — это потенциальная утечка данных, репутационный или финансовый инцидент. Эта статья адресована бэкенд-разработчикам, которые уже выкатили агента в прод или готовятся это сделать. Она является практическим продолжением нашего предыдущего материала о Red Teaming LLM : там мы разобрали концептуальную базу и объяснили, почему языковые модели требуют отдельного подхода к тестированию безопасности. Здесь — конкретный кейс из реальной практики
https://habr.com/ru/companies/doubletapp/articles/1034976/
#red_teaming #ииагенты #ииассистент #иимодель #ии_агенты #безопасность #безопасность_данных #кибербезопасность
-
ИИ-агенты в проде: как измерить безопасность и снизить риски внедрения
Недоверие бизнеса к агентным решениям растёт пропорционально их распространению. И это недоверие небезосновательно: агент — это не просто чат-бот с улучшенным промптом. Это система с доступом к инструментам, внешним сервисам и корпоративным данным. Ошибка модели в изолированном чате — это неловкость. Ошибка агента с доступом к почте и документам — это потенциальная утечка данных, репутационный или финансовый инцидент. Эта статья адресована бэкенд-разработчикам, которые уже выкатили агента в прод или готовятся это сделать. Она является практическим продолжением нашего предыдущего материала о Red Teaming LLM : там мы разобрали концептуальную базу и объяснили, почему языковые модели требуют отдельного подхода к тестированию безопасности. Здесь — конкретный кейс из реальной практики
https://habr.com/ru/companies/doubletapp/articles/1034976/
#red_teaming #ииагенты #ииассистент #иимодель #ии_агенты #безопасность #безопасность_данных #кибербезопасность
-
Ищем самый быстрый XML парсер для Apple платформы с помощью ИИ
Нет, это не déjà vu, это продолжение моей прошлой статьи Самый быстрый XML парсер для iOS в 2026 году? Чтобы вам не тратить время на ее чтение, вот краткий пересказ. В прошлой статье происходит поиск самого быстрого XML парсера со следующими характиристиками: Для Apple платформы (iOS, tvOS, macOS) Язык Objective-C или Swift GitHub как источник исходников Популярный (хотя бы больше 500 звезд) Любая интеграция (CocoaPods, SwiftPM) И самое важное, весь бенчмарк я писал сам с небольшой помощью ИИ, не спеша, под несколько чашечек кофе за 3 часа я нашел нужный мне XML парсер. Спустя пару месяцев после выхода первой статьи, мне пришла мысль, зачем я тратил 3 часа на эту задачу, если можно было просто это самое задание “скормить” ИИшке и она бы за 5 минут решила бы ее (так пишут в интернетах). Тут же пришла вторая идея. Так как у меня есть мною лично проверенный результат, то я могу загрузить этой задачей все популярные ИИ и их результаты сравнить со своим. Даже не исключаю, что у меня где-то есть ошибка и тогда рейтинг парсеров будет выглядеть совсем иначе и я выбрал не самый быстрый как хотел. Собственно, что я и сделал. Загнал задачу в топ 15 ИИ и сравнил их результаты со своим. Если вам интересно, кто справился с задачей, кто спасовал, будет описано в развернутой статье под катом. Для затравки, наихудший результат и последнее место занимает GPT 5.5 Pro. А Claude Opus 4.7 не смог взять первое место.
-
Ищем самый быстрый XML парсер для Apple платформы с помощью ИИ
Нет, это не déjà vu, это продолжение моей прошлой статьи Самый быстрый XML парсер для iOS в 2026 году? Чтобы вам не тратить время на ее чтение, вот краткий пересказ. В прошлой статье происходит поиск самого быстрого XML парсера со следующими характиристиками: Для Apple платформы (iOS, tvOS, macOS) Язык Objective-C или Swift GitHub как источник исходников Популярный (хотя бы больше 500 звезд) Любая интеграция (CocoaPods, SwiftPM) И самое важное, весь бенчмарк я писал сам с небольшой помощью ИИ, не спеша, под несколько чашечек кофе за 3 часа я нашел нужный мне XML парсер. Спустя пару месяцев после выхода первой статьи, мне пришла мысль, зачем я тратил 3 часа на эту задачу, если можно было просто это самое задание “скормить” ИИшке и она бы за 5 минут решила бы ее (так пишут в интернетах). Тут же пришла вторая идея. Так как у меня есть мною лично проверенный результат, то я могу загрузить этой задачей все популярные ИИ и их результаты сравнить со своим. Даже не исключаю, что у меня где-то есть ошибка и тогда рейтинг парсеров будет выглядеть совсем иначе и я выбрал не самый быстрый как хотел. Собственно, что я и сделал. Загнал задачу в топ 15 ИИ и сравнил их результаты со своим. Если вам интересно, кто справился с задачей, кто спасовал, будет описано в развернутой статье под катом. Для затравки, наихудший результат и последнее место занимает GPT 5.5 Pro. А Claude Opus 4.7 не смог взять первое место.
-
Ищем самый быстрый XML парсер для Apple платформы с помощью ИИ
Нет, это не déjà vu, это продолжение моей прошлой статьи Самый быстрый XML парсер для iOS в 2026 году? Чтобы вам не тратить время на ее чтение, вот краткий пересказ. В прошлой статье происходит поиск самого быстрого XML парсера со следующими характиристиками: Для Apple платформы (iOS, tvOS, macOS) Язык Objective-C или Swift GitHub как источник исходников Популярный (хотя бы больше 500 звезд) Любая интеграция (CocoaPods, SwiftPM) И самое важное, весь бенчмарк я писал сам с небольшой помощью ИИ, не спеша, под несколько чашечек кофе за 3 часа я нашел нужный мне XML парсер. Спустя пару месяцев после выхода первой статьи, мне пришла мысль, зачем я тратил 3 часа на эту задачу, если можно было просто это самое задание “скормить” ИИшке и она бы за 5 минут решила бы ее (так пишут в интернетах). Тут же пришла вторая идея. Так как у меня есть мною лично проверенный результат, то я могу загрузить этой задачей все популярные ИИ и их результаты сравнить со своим. Даже не исключаю, что у меня где-то есть ошибка и тогда рейтинг парсеров будет выглядеть совсем иначе и я выбрал не самый быстрый как хотел. Собственно, что я и сделал. Загнал задачу в топ 15 ИИ и сравнил их результаты со своим. Если вам интересно, кто справился с задачей, кто спасовал, будет описано в развернутой статье под катом. Для затравки, наихудший результат и последнее место занимает GPT 5.5 Pro. А Claude Opus 4.7 не смог взять первое место.
-
Ищем самый быстрый XML парсер для Apple платформы с помощью ИИ
Нет, это не déjà vu, это продолжение моей прошлой статьи Самый быстрый XML парсер для iOS в 2026 году? Чтобы вам не тратить время на ее чтение, вот краткий пересказ. В прошлой статье происходит поиск самого быстрого XML парсера со следующими характиристиками: Для Apple платформы (iOS, tvOS, macOS) Язык Objective-C или Swift GitHub как источник исходников Популярный (хотя бы больше 500 звезд) Любая интеграция (CocoaPods, SwiftPM) И самое важное, весь бенчмарк я писал сам с небольшой помощью ИИ, не спеша, под несколько чашечек кофе за 3 часа я нашел нужный мне XML парсер. Спустя пару месяцев после выхода первой статьи, мне пришла мысль, зачем я тратил 3 часа на эту задачу, если можно было просто это самое задание “скормить” ИИшке и она бы за 5 минут решила бы ее (так пишут в интернетах). Тут же пришла вторая идея. Так как у меня есть мною лично проверенный результат, то я могу загрузить этой задачей все популярные ИИ и их результаты сравнить со своим. Даже не исключаю, что у меня где-то есть ошибка и тогда рейтинг парсеров будет выглядеть совсем иначе и я выбрал не самый быстрый как хотел. Собственно, что я и сделал. Загнал задачу в топ 15 ИИ и сравнил их результаты со своим. Если вам интересно, кто справился с задачей, кто спасовал, будет описано в развернутой статье под катом. Для затравки, наихудший результат и последнее место занимает GPT 5.5 Pro. А Claude Opus 4.7 не смог взять первое место.
-
Среда агента: контекст, архитектурные границы, память проекта
Пятая статья из шести про инженерный процесс для разработки с ИИ-агентами. Первая статья про путь от первых проектов к стандарту SENAR. Вторая про то, чем агент отличается от программиста. Третья про новую роль человека и пять навыков нового рабочего режима. Четвёртая про ворота задачи: спецификацию на входе, сверку с критериями на выходе и метрики, которые видят, что в контуре провисло. Эта пятая про среду, в которой задача живёт от постановки до сдачи: контекст под неё, архитектурные границы вокруг и память проекта над всем.
https://habr.com/ru/articles/1034788/
#ииагенты #claude_code #llm #aiразработка #методология_разработки #senar #tausik #контекстинжиниринг #архитектура #инженерные_практики
-
Среда агента: контекст, архитектурные границы, память проекта
Пятая статья из шести про инженерный процесс для разработки с ИИ-агентами. Первая статья про путь от первых проектов к стандарту SENAR. Вторая про то, чем агент отличается от программиста. Третья про новую роль человека и пять навыков нового рабочего режима. Четвёртая про ворота задачи: спецификацию на входе, сверку с критериями на выходе и метрики, которые видят, что в контуре провисло. Эта пятая про среду, в которой задача живёт от постановки до сдачи: контекст под неё, архитектурные границы вокруг и память проекта над всем.
https://habr.com/ru/articles/1034788/
#ииагенты #claude_code #llm #aiразработка #методология_разработки #senar #tausik #контекстинжиниринг #архитектура #инженерные_практики
-
Среда агента: контекст, архитектурные границы, память проекта
Пятая статья из шести про инженерный процесс для разработки с ИИ-агентами. Первая статья про путь от первых проектов к стандарту SENAR. Вторая про то, чем агент отличается от программиста. Третья про новую роль человека и пять навыков нового рабочего режима. Четвёртая про ворота задачи: спецификацию на входе, сверку с критериями на выходе и метрики, которые видят, что в контуре провисло. Эта пятая про среду, в которой задача живёт от постановки до сдачи: контекст под неё, архитектурные границы вокруг и память проекта над всем.
https://habr.com/ru/articles/1034788/
#ииагенты #claude_code #llm #aiразработка #методология_разработки #senar #tausik #контекстинжиниринг #архитектура #инженерные_практики
-
Среда агента: контекст, архитектурные границы, память проекта
Пятая статья из шести про инженерный процесс для разработки с ИИ-агентами. Первая статья про путь от первых проектов к стандарту SENAR. Вторая про то, чем агент отличается от программиста. Третья про новую роль человека и пять навыков нового рабочего режима. Четвёртая про ворота задачи: спецификацию на входе, сверку с критериями на выходе и метрики, которые видят, что в контуре провисло. Эта пятая про среду, в которой задача живёт от постановки до сдачи: контекст под неё, архитектурные границы вокруг и память проекта над всем.
https://habr.com/ru/articles/1034788/
#ииагенты #claude_code #llm #aiразработка #методология_разработки #senar #tausik #контекстинжиниринг #архитектура #инженерные_практики
-
Вы пустили ИИ-агента в репозиторий, теперь разбираемся, что он может сломать
В феврале 2026 года Claude Cowork стирает 15 лет семейных фотографий одной командой. За полгода до этого, в августе 2025-го, случился кейс Nx supply chain: малварь впервые в истории использует локальные ИИ-CLI как инструмент разведки. В марте этого года Google Cloud Threat Horizons H1-2026 подтверждает: часть украденных в Nx токенов используется кампанией UNC6426 для перехода CI/CD → cloud admin через злоупотребление OIDC. 72 часа от первого коммита до админских прав в AWS. Всё это примеры того, что может происходить, когда у ИИ-агента есть руки и мы забываем, на чьей машине эти руки действуют. Данная статья предназначается для неравнодушных инженеров, AppSec, DevSecOps специалистов и всех тех, кто хоть раз запускал агента у себя на машине. Запрещать агентов в контуре бесполезно, отказываться от них самому глупо, но чем они так опасны? Сперва развеем туман неясности, построим модель угроз, собранную на реальных инцидентах и опубликованных CVE, а после будут конкретные рекомендации, как ограничить агента песочницей без ущерба для эффективности разработки. И как запускать --dangerously-skip-permissions без страха.
https://habr.com/ru/companies/pt/articles/1030532/
#ИИагенты #безопасность #OWASP #supply_chain #Claude_Code #prompt_injection #DevSecOps
-
Вы пустили ИИ-агента в репозиторий, теперь разбираемся, что он может сломать
В феврале 2026 года Claude Cowork стирает 15 лет семейных фотографий одной командой. За полгода до этого, в августе 2025-го, случился кейс Nx supply chain: малварь впервые в истории использует локальные ИИ-CLI как инструмент разведки. В марте этого года Google Cloud Threat Horizons H1-2026 подтверждает: часть украденных в Nx токенов используется кампанией UNC6426 для перехода CI/CD → cloud admin через злоупотребление OIDC. 72 часа от первого коммита до админских прав в AWS. Всё это примеры того, что может происходить, когда у ИИ-агента есть руки и мы забываем, на чьей машине эти руки действуют. Данная статья предназначается для неравнодушных инженеров, AppSec, DevSecOps специалистов и всех тех, кто хоть раз запускал агента у себя на машине. Запрещать агентов в контуре бесполезно, отказываться от них самому глупо, но чем они так опасны? Сперва развеем туман неясности, построим модель угроз, собранную на реальных инцидентах и опубликованных CVE, а после будут конкретные рекомендации, как ограничить агента песочницей без ущерба для эффективности разработки. И как запускать --dangerously-skip-permissions без страха.
https://habr.com/ru/companies/pt/articles/1030532/
#ИИагенты #безопасность #OWASP #supply_chain #Claude_Code #prompt_injection #DevSecOps
-
Вы пустили ИИ-агента в репозиторий, теперь разбираемся, что он может сломать
В феврале 2026 года Claude Cowork стирает 15 лет семейных фотографий одной командой. За полгода до этого, в августе 2025-го, случился кейс Nx supply chain: малварь впервые в истории использует локальные ИИ-CLI как инструмент разведки. В марте этого года Google Cloud Threat Horizons H1-2026 подтверждает: часть украденных в Nx токенов используется кампанией UNC6426 для перехода CI/CD → cloud admin через злоупотребление OIDC. 72 часа от первого коммита до админских прав в AWS. Всё это примеры того, что может происходить, когда у ИИ-агента есть руки и мы забываем, на чьей машине эти руки действуют. Данная статья предназначается для неравнодушных инженеров, AppSec, DevSecOps специалистов и всех тех, кто хоть раз запускал агента у себя на машине. Запрещать агентов в контуре бесполезно, отказываться от них самому глупо, но чем они так опасны? Сперва развеем туман неясности, построим модель угроз, собранную на реальных инцидентах и опубликованных CVE, а после будут конкретные рекомендации, как ограничить агента песочницей без ущерба для эффективности разработки. И как запускать --dangerously-skip-permissions без страха.
https://habr.com/ru/companies/pt/articles/1030532/
#ИИагенты #безопасность #OWASP #supply_chain #Claude_Code #prompt_injection #DevSecOps
-
Вы пустили ИИ-агента в репозиторий, теперь разбираемся, что он может сломать
В феврале 2026 года Claude Cowork стирает 15 лет семейных фотографий одной командой. За полгода до этого, в августе 2025-го, случился кейс Nx supply chain: малварь впервые в истории использует локальные ИИ-CLI как инструмент разведки. В марте этого года Google Cloud Threat Horizons H1-2026 подтверждает: часть украденных в Nx токенов используется кампанией UNC6426 для перехода CI/CD → cloud admin через злоупотребление OIDC. 72 часа от первого коммита до админских прав в AWS. Всё это примеры того, что может происходить, когда у ИИ-агента есть руки и мы забываем, на чьей машине эти руки действуют. Данная статья предназначается для неравнодушных инженеров, AppSec, DevSecOps специалистов и всех тех, кто хоть раз запускал агента у себя на машине. Запрещать агентов в контуре бесполезно, отказываться от них самому глупо, но чем они так опасны? Сперва развеем туман неясности, построим модель угроз, собранную на реальных инцидентах и опубликованных CVE, а после будут конкретные рекомендации, как ограничить агента песочницей без ущерба для эффективности разработки. И как запускать --dangerously-skip-permissions без страха.
https://habr.com/ru/companies/pt/articles/1030532/
#ИИагенты #безопасность #OWASP #supply_chain #Claude_Code #prompt_injection #DevSecOps
-
[Перевод] Создание MCP‑серверов на FastMCP: 7 ошибок, которых стоит избегать
FastMCP позволяет быстро собрать MCP‑сервер, но скорость легко оборачивается ошибками: лишние токены, слабые схемы, сырые API‑примитивы, плохая обработка ошибок и риски безопасности. В статье разбираем 7 проблем, из‑за которых LLM‑агент начинает путаться, ломать сценарии и требовать лишних подтверждений, — и показываем, как их исправить.
https://habr.com/ru/companies/otus/articles/1032890/
#MCP #FastMCP #ИИагенты #LLM #Python #API #безопасность #обработка_ошибок #токены #проектирование_инструментов
-
AI-рекрутер, который никогда не устает: как мы автоматизировали скрининг кандидатов
Привет, Хабр! На связи команда Just AI. Мы занимаемся разработкой AI-агентов, и в какой-то момент решили автоматизировать собственный процесс найма . В итоге сделали агента, который проводит первичный скрининг кандидатов: задает вопросы, оценивает ответы и отправляет рекрутеру письмо с готовым вердиктом. В этой статье разобрали, зачем мы это сделали, как устроена система изнутри, с какими проблемами столкнулись и что получилось в итоге.
https://habr.com/ru/companies/just_ai/articles/1034606/
#рекрутинг_в_it #ai_agents #автоматизация_найма #hr_автоматизация #ииагенты #ииагенты_для_бизнеса #чатботы #чат_на_сайт #ai #мультиагентные_системы
-
[Перевод] Создание MCP‑серверов на FastMCP: 7 ошибок, которых стоит избегать
FastMCP позволяет быстро собрать MCP‑сервер, но скорость легко оборачивается ошибками: лишние токены, слабые схемы, сырые API‑примитивы, плохая обработка ошибок и риски безопасности. В статье разбираем 7 проблем, из‑за которых LLM‑агент начинает путаться, ломать сценарии и требовать лишних подтверждений, — и показываем, как их исправить.
https://habr.com/ru/companies/otus/articles/1032890/
#MCP #FastMCP #ИИагенты #LLM #Python #API #безопасность #обработка_ошибок #токены #проектирование_инструментов
-
AI-рекрутер, который никогда не устает: как мы автоматизировали скрининг кандидатов
Привет, Хабр! На связи команда Just AI. Мы занимаемся разработкой AI-агентов, и в какой-то момент решили автоматизировать собственный процесс найма . В итоге сделали агента, который проводит первичный скрининг кандидатов: задает вопросы, оценивает ответы и отправляет рекрутеру письмо с готовым вердиктом. В этой статье разобрали, зачем мы это сделали, как устроена система изнутри, с какими проблемами столкнулись и что получилось в итоге.
https://habr.com/ru/companies/just_ai/articles/1034606/
#рекрутинг_в_it #ai_agents #автоматизация_найма #hr_автоматизация #ииагенты #ииагенты_для_бизнеса #чатботы #чат_на_сайт #ai #мультиагентные_системы
-
[Перевод] Создание MCP‑серверов на FastMCP: 7 ошибок, которых стоит избегать
FastMCP позволяет быстро собрать MCP‑сервер, но скорость легко оборачивается ошибками: лишние токены, слабые схемы, сырые API‑примитивы, плохая обработка ошибок и риски безопасности. В статье разбираем 7 проблем, из‑за которых LLM‑агент начинает путаться, ломать сценарии и требовать лишних подтверждений, — и показываем, как их исправить.
https://habr.com/ru/companies/otus/articles/1032890/
#MCP #FastMCP #ИИагенты #LLM #Python #API #безопасность #обработка_ошибок #токены #проектирование_инструментов
-
AI-рекрутер, который никогда не устает: как мы автоматизировали скрининг кандидатов
Привет, Хабр! На связи команда Just AI. Мы занимаемся разработкой AI-агентов, и в какой-то момент решили автоматизировать собственный процесс найма . В итоге сделали агента, который проводит первичный скрининг кандидатов: задает вопросы, оценивает ответы и отправляет рекрутеру письмо с готовым вердиктом. В этой статье разобрали, зачем мы это сделали, как устроена система изнутри, с какими проблемами столкнулись и что получилось в итоге.
https://habr.com/ru/companies/just_ai/articles/1034606/
#рекрутинг_в_it #ai_agents #автоматизация_найма #hr_автоматизация #ииагенты #ииагенты_для_бизнеса #чатботы #чат_на_сайт #ai #мультиагентные_системы
-
[Перевод] Создание MCP‑серверов на FastMCP: 7 ошибок, которых стоит избегать
FastMCP позволяет быстро собрать MCP‑сервер, но скорость легко оборачивается ошибками: лишние токены, слабые схемы, сырые API‑примитивы, плохая обработка ошибок и риски безопасности. В статье разбираем 7 проблем, из‑за которых LLM‑агент начинает путаться, ломать сценарии и требовать лишних подтверждений, — и показываем, как их исправить.
https://habr.com/ru/companies/otus/articles/1032890/
#MCP #FastMCP #ИИагенты #LLM #Python #API #безопасность #обработка_ошибок #токены #проектирование_инструментов
-
AI-рекрутер, который никогда не устает: как мы автоматизировали скрининг кандидатов
Привет, Хабр! На связи команда Just AI. Мы занимаемся разработкой AI-агентов, и в какой-то момент решили автоматизировать собственный процесс найма . В итоге сделали агента, который проводит первичный скрининг кандидатов: задает вопросы, оценивает ответы и отправляет рекрутеру письмо с готовым вердиктом. В этой статье разобрали, зачем мы это сделали, как устроена система изнутри, с какими проблемами столкнулись и что получилось в итоге.
https://habr.com/ru/companies/just_ai/articles/1034606/
#рекрутинг_в_it #ai_agents #автоматизация_найма #hr_автоматизация #ииагенты #ииагенты_для_бизнеса #чатботы #чат_на_сайт #ai #мультиагентные_системы
-
Лучший код занял второе место: разбираем финал Dev-to-Dev хакатона и ищем границы агентной инженерии
В финале хакатона Dev-to-Dev: Agentic Engineering Challenge на втором месте оказался самый качественно написанный проект соревнования. 65 тестов, типы, защита от path traversal, Docker с non-root user, архитектура, в которой видно инженера, а не участника хакатона. И именно поэтому он не победил. Победителем стал не самый чистый код и не самая смелая архитектура. Это решение точнее всех попало в то, что мы пытались измерить — agentic engineering. Термин, которому едва пара лет, и в который каждая команда пока вкладывает что-то своё. Ниже разбираем 10 финалистов хакатона: что они построили, где заработали баллы и где их потеряли, какие архитектурные ставки сработали — и почему «писать хороший код» и «строить агентные системы» в 2026 году превратились в разные навыки.
https://habr.com/ru/articles/1034362/
#искусственный_интеллект #агентное_программирование #ииагенты #python #mcp #mcpserver #fastmcp #agentic_engineering #docker #claudemd
-
Лучший код занял второе место: разбираем финал Dev-to-Dev хакатона и ищем границы агентной инженерии
В финале хакатона Dev-to-Dev: Agentic Engineering Challenge на втором месте оказался самый качественно написанный проект соревнования. 65 тестов, типы, защита от path traversal, Docker с non-root user, архитектура, в которой видно инженера, а не участника хакатона. И именно поэтому он не победил. Победителем стал не самый чистый код и не самая смелая архитектура. Это решение точнее всех попало в то, что мы пытались измерить — agentic engineering. Термин, которому едва пара лет, и в который каждая команда пока вкладывает что-то своё. Ниже разбираем 10 финалистов хакатона: что они построили, где заработали баллы и где их потеряли, какие архитектурные ставки сработали — и почему «писать хороший код» и «строить агентные системы» в 2026 году превратились в разные навыки.
https://habr.com/ru/articles/1034362/
#искусственный_интеллект #агентное_программирование #ииагенты #python #mcp #mcpserver #fastmcp #agentic_engineering #docker #claudemd
-
Лучший код занял второе место: разбираем финал Dev-to-Dev хакатона и ищем границы агентной инженерии
В финале хакатона Dev-to-Dev: Agentic Engineering Challenge на втором месте оказался самый качественно написанный проект соревнования. 65 тестов, типы, защита от path traversal, Docker с non-root user, архитектура, в которой видно инженера, а не участника хакатона. И именно поэтому он не победил. Победителем стал не самый чистый код и не самая смелая архитектура. Это решение точнее всех попало в то, что мы пытались измерить — agentic engineering. Термин, которому едва пара лет, и в который каждая команда пока вкладывает что-то своё. Ниже разбираем 10 финалистов хакатона: что они построили, где заработали баллы и где их потеряли, какие архитектурные ставки сработали — и почему «писать хороший код» и «строить агентные системы» в 2026 году превратились в разные навыки.
https://habr.com/ru/articles/1034362/
#искусственный_интеллект #агентное_программирование #ииагенты #python #mcp #mcpserver #fastmcp #agentic_engineering #docker #claudemd
-
Лучший код занял второе место: разбираем финал Dev-to-Dev хакатона и ищем границы агентной инженерии
В финале хакатона Dev-to-Dev: Agentic Engineering Challenge на втором месте оказался самый качественно написанный проект соревнования. 65 тестов, типы, защита от path traversal, Docker с non-root user, архитектура, в которой видно инженера, а не участника хакатона. И именно поэтому он не победил. Победителем стал не самый чистый код и не самая смелая архитектура. Это решение точнее всех попало в то, что мы пытались измерить — agentic engineering. Термин, которому едва пара лет, и в который каждая команда пока вкладывает что-то своё. Ниже разбираем 10 финалистов хакатона: что они построили, где заработали баллы и где их потеряли, какие архитектурные ставки сработали — и почему «писать хороший код» и «строить агентные системы» в 2026 году превратились в разные навыки.
https://habr.com/ru/articles/1034362/
#искусственный_интеллект #агентное_программирование #ииагенты #python #mcp #mcpserver #fastmcp #agentic_engineering #docker #claudemd
-
Как сделать ИИ-агентов безопасными? Разбор архитектуры безопасности агентского ИИ от OpenAI
Когда агент может сам читать репозитории, выполнять shell-команды и взаимодействовать с инструментами разработки, возникает закономерный вопрос: как обеспечить информ.безопасность? OpenAI опубликовали подробности о том, как они сами у себя внутри работают с агентами. Разберём по частям. Что такое Codex, для тех, кто еще не успел попробовать Codex - это ИИ-агент: он автономно обходит репозитории, запускает команды, дёргает внешние API и инструменты разработчика. Агенты могут работать параллельно, в изолированных копиях кода, а пользователь переключается между задачами, смотрит изменения и забирает результат. Зачастую пользователи создают мультиагентскую среду, не требующую участия человека. Если учесть, что и с человеком дыры в безопасности поражают, то о какой безопасности может идти речь, если агенты имеют вседозволенность в контуре? Именно поэтому у OpenAI сформировался чёткий принцип развёртывания: низкорисковые действия - без остановок, высокорисковые - с проверкой . Слой 1: Песочница и система одобрений Первая линия контроля sandbox. Он определяет техническую границу выполнения, куда Codex может писать, к каким путям имеет доступ, что остаётся защищённым. Поверх sandbox работает политика одобрений: если агент хочет сделать что-то за пределами песочницы, он обязан запросить разрешение. Пользователь может одобрить действие разово или разрешить целый класс действий на сессию. Чтобы агент не превращался в машину по генерации диалогов "разрешить/запретить", OpenAI добавили режим автопроверки ( auto_review ). Это субагент, который запущен рядом и молча одобряет рутинные низкорисковые запросы без прерывания пользователя. Но стоит появиться чему-то нестандартному или потенциально опасному - управление передаётся человеку.
-
Как сделать ИИ-агентов безопасными? Разбор архитектуры безопасности агентского ИИ от OpenAI
Когда агент может сам читать репозитории, выполнять shell-команды и взаимодействовать с инструментами разработки, возникает закономерный вопрос: как обеспечить информ.безопасность? OpenAI опубликовали подробности о том, как они сами у себя внутри работают с агентами. Разберём по частям. Что такое Codex, для тех, кто еще не успел попробовать Codex - это ИИ-агент: он автономно обходит репозитории, запускает команды, дёргает внешние API и инструменты разработчика. Агенты могут работать параллельно, в изолированных копиях кода, а пользователь переключается между задачами, смотрит изменения и забирает результат. Зачастую пользователи создают мультиагентскую среду, не требующую участия человека. Если учесть, что и с человеком дыры в безопасности поражают, то о какой безопасности может идти речь, если агенты имеют вседозволенность в контуре? Именно поэтому у OpenAI сформировался чёткий принцип развёртывания: низкорисковые действия - без остановок, высокорисковые - с проверкой . Слой 1: Песочница и система одобрений Первая линия контроля sandbox. Он определяет техническую границу выполнения, куда Codex может писать, к каким путям имеет доступ, что остаётся защищённым. Поверх sandbox работает политика одобрений: если агент хочет сделать что-то за пределами песочницы, он обязан запросить разрешение. Пользователь может одобрить действие разово или разрешить целый класс действий на сессию. Чтобы агент не превращался в машину по генерации диалогов "разрешить/запретить", OpenAI добавили режим автопроверки ( auto_review ). Это субагент, который запущен рядом и молча одобряет рутинные низкорисковые запросы без прерывания пользователя. Но стоит появиться чему-то нестандартному или потенциально опасному - управление передаётся человеку.
-
Как сделать ИИ-агентов безопасными? Разбор архитектуры безопасности агентского ИИ от OpenAI
Когда агент может сам читать репозитории, выполнять shell-команды и взаимодействовать с инструментами разработки, возникает закономерный вопрос: как обеспечить информ.безопасность? OpenAI опубликовали подробности о том, как они сами у себя внутри работают с агентами. Разберём по частям. Что такое Codex, для тех, кто еще не успел попробовать Codex - это ИИ-агент: он автономно обходит репозитории, запускает команды, дёргает внешние API и инструменты разработчика. Агенты могут работать параллельно, в изолированных копиях кода, а пользователь переключается между задачами, смотрит изменения и забирает результат. Зачастую пользователи создают мультиагентскую среду, не требующую участия человека. Если учесть, что и с человеком дыры в безопасности поражают, то о какой безопасности может идти речь, если агенты имеют вседозволенность в контуре? Именно поэтому у OpenAI сформировался чёткий принцип развёртывания: низкорисковые действия - без остановок, высокорисковые - с проверкой . Слой 1: Песочница и система одобрений Первая линия контроля sandbox. Он определяет техническую границу выполнения, куда Codex может писать, к каким путям имеет доступ, что остаётся защищённым. Поверх sandbox работает политика одобрений: если агент хочет сделать что-то за пределами песочницы, он обязан запросить разрешение. Пользователь может одобрить действие разово или разрешить целый класс действий на сессию. Чтобы агент не превращался в машину по генерации диалогов "разрешить/запретить", OpenAI добавили режим автопроверки ( auto_review ). Это субагент, который запущен рядом и молча одобряет рутинные низкорисковые запросы без прерывания пользователя. Но стоит появиться чему-то нестандартному или потенциально опасному - управление передаётся человеку.