home.social

#ии-агенты — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #ии-агенты, aggregated by home.social.

fetched live
  1. Agent Gateway в Google Cloud: внешний контур управления AI-агентами, которого не хватало enterprise

    Не так давно AI-агент для разработки кода (Cursor на базе модели Anthropic Claude Opus 4.6) получил задачу и выполнил её буквально. Слишком буквально. За 9 секунд он уничтожил базу данных компании вместе с резервными копиями. Когда его спросили об этом, агент ответил: "Я нарушил каждый принцип, который мне дали". Этот случай произошел в стартапе PocketOS В этой статье я расскажу Вам, при помощи какого инструмента в Google Cloud можно избежать подобных ситуаций. Подробно разберем что такое Agent Gateway, из чего он состоит, какие плюсы он нам даст, и стоит ли рассматривать его в проекте. Читать далее про Agent Gateway

    habr.com/ru/articles/1036346/

    #GoogleCloud #ииагенты #aiagent #security #ai_infrastructure #облачная_инфраструктура

  2. Agent Gateway в Google Cloud: внешний контур управления AI-агентами, которого не хватало enterprise

    Не так давно AI-агент для разработки кода (Cursor на базе модели Anthropic Claude Opus 4.6) получил задачу и выполнил её буквально. Слишком буквально. За 9 секунд он уничтожил базу данных компании вместе с резервными копиями. Когда его спросили об этом, агент ответил: "Я нарушил каждый принцип, который мне дали". Этот случай произошел в стартапе PocketOS В этой статье я расскажу Вам, при помощи какого инструмента в Google Cloud можно избежать подобных ситуаций. Подробно разберем что такое Agent Gateway, из чего он состоит, какие плюсы он нам даст, и стоит ли рассматривать его в проекте. Читать далее про Agent Gateway

    habr.com/ru/articles/1036346/

    #GoogleCloud #ииагенты #aiagent #security #ai_infrastructure #облачная_инфраструктура

  3. Agent Gateway в Google Cloud: внешний контур управления AI-агентами, которого не хватало enterprise

    Не так давно AI-агент для разработки кода (Cursor на базе модели Anthropic Claude Opus 4.6) получил задачу и выполнил её буквально. Слишком буквально. За 9 секунд он уничтожил базу данных компании вместе с резервными копиями. Когда его спросили об этом, агент ответил: "Я нарушил каждый принцип, который мне дали". Этот случай произошел в стартапе PocketOS В этой статье я расскажу Вам, при помощи какого инструмента в Google Cloud можно избежать подобных ситуаций. Подробно разберем что такое Agent Gateway, из чего он состоит, какие плюсы он нам даст, и стоит ли рассматривать его в проекте. Читать далее про Agent Gateway

    habr.com/ru/articles/1036346/

    #GoogleCloud #ииагенты #aiagent #security #ai_infrastructure #облачная_инфраструктура

  4. Agent Gateway в Google Cloud: внешний контур управления AI-агентами, которого не хватало enterprise

    Не так давно AI-агент для разработки кода (Cursor на базе модели Anthropic Claude Opus 4.6) получил задачу и выполнил её буквально. Слишком буквально. За 9 секунд он уничтожил базу данных компании вместе с резервными копиями. Когда его спросили об этом, агент ответил: "Я нарушил каждый принцип, который мне дали". Этот случай произошел в стартапе PocketOS В этой статье я расскажу Вам, при помощи какого инструмента в Google Cloud можно избежать подобных ситуаций. Подробно разберем что такое Agent Gateway, из чего он состоит, какие плюсы он нам даст, и стоит ли рассматривать его в проекте. Читать далее про Agent Gateway

    habr.com/ru/articles/1036346/

    #GoogleCloud #ииагенты #aiagent #security #ai_infrastructure #облачная_инфраструктура

  5. Claude Code в 54 раза дешевле. Я все протестил

    В этой статье я расскажу, как попробовал дешевую альтернативу Claude, создал рабочую программу для macOS и вместо 13$ - потратил 0.25$

    habr.com/ru/articles/1036144/

    #claude_code #deepseek #ии #ииагенты #ииассистент #иимодель #дешево #вайбкодинг #вайбкодинг #вайбпрограммирование

  6. Claude Code в 54 раза дешевле. Я все протестил

    В этой статье я расскажу, как попробовал дешевую альтернативу Claude, создал рабочую программу для macOS и вместо 13$ - потратил 0.25$

    habr.com/ru/articles/1036144/

    #claude_code #deepseek #ии #ииагенты #ииассистент #иимодель #дешево #вайбкодинг #вайбкодинг #вайбпрограммирование

  7. Claude Code в 54 раза дешевле. Я все протестил

    В этой статье я расскажу, как попробовал дешевую альтернативу Claude, создал рабочую программу для macOS и вместо 13$ - потратил 0.25$

    habr.com/ru/articles/1036144/

    #claude_code #deepseek #ии #ииагенты #ииассистент #иимодель #дешево #вайбкодинг #вайбкодинг #вайбпрограммирование

  8. Claude Code в 54 раза дешевле. Я все протестил

    В этой статье я расскажу, как попробовал дешевую альтернативу Claude, создал рабочую программу для macOS и вместо 13$ - потратил 0.25$

    habr.com/ru/articles/1036144/

    #claude_code #deepseek #ии #ииагенты #ииассистент #иимодель #дешево #вайбкодинг #вайбкодинг #вайбпрограммирование

  9. Claude Code в 54 раза дешевле. Я все протестил В этой статье я расскажу, как попробовал дешевую альтернативу Claude, с...

    #claude #code #deepseek #ии #ии-агенты #ии-ассистент #ии-модель #дешево #вайб-кодинг #вайбкодинг #вайб-программирование

    Origin | Interest | Match
  10. Как создать ИИ-агента для бизнеса за 10 шагов. Гайд с учётом российской специфики API

    Нейросети можно объединять в полноценные рабочие системы. Такие системы называют ИИ-агентами. Их используют в поддержке, продажах, аналитике, HR, логистике и внутренних процессах — везде, где есть повторяемые задачи, понятные правила и данные, к которым можно подключиться. Но при сборке ИИ-агента важно учитывать российскую специфику API.

    habr.com/ru/companies/tsnis/ar

    #агенты #ииагенты #создать_ииагента #создание_ииагента #ииагент_для_бизнеса #создать_ииагента_для_бизнеса #создание_ииагента_для_бизнеса #api #api_нейросетей

  11. Как создать ИИ-агента для бизнеса за 10 шагов. Гайд с учётом российской специфики API

    Нейросети можно объединять в полноценные рабочие системы. Такие системы называют ИИ-агентами. Их используют в поддержке, продажах, аналитике, HR, логистике и внутренних процессах — везде, где есть повторяемые задачи, понятные правила и данные, к которым можно подключиться. Но при сборке ИИ-агента важно учитывать российскую специфику API.

    habr.com/ru/companies/tsnis/ar

    #агенты #ииагенты #создать_ииагента #создание_ииагента #ииагент_для_бизнеса #создать_ииагента_для_бизнеса #создание_ииагента_для_бизнеса #api #api_нейросетей

  12. Как создать ИИ-агента для бизнеса за 10 шагов. Гайд с учётом российской специфики API

    Нейросети можно объединять в полноценные рабочие системы. Такие системы называют ИИ-агентами. Их используют в поддержке, продажах, аналитике, HR, логистике и внутренних процессах — везде, где есть повторяемые задачи, понятные правила и данные, к которым можно подключиться. Но при сборке ИИ-агента важно учитывать российскую специфику API.

    habr.com/ru/companies/tsnis/ar

    #агенты #ииагенты #создать_ииагента #создание_ииагента #ииагент_для_бизнеса #создать_ииагента_для_бизнеса #создание_ииагента_для_бизнеса #api #api_нейросетей

  13. Как создать ИИ-агента для бизнеса за 10 шагов. Гайд с учётом российской специфики API

    Нейросети можно объединять в полноценные рабочие системы. Такие системы называют ИИ-агентами. Их используют в поддержке, продажах, аналитике, HR, логистике и внутренних процессах — везде, где есть повторяемые задачи, понятные правила и данные, к которым можно подключиться. Но при сборке ИИ-агента важно учитывать российскую специфику API.

    habr.com/ru/companies/tsnis/ar

    #агенты #ииагенты #создать_ииагента #создание_ииагента #ииагент_для_бизнеса #создать_ииагента_для_бизнеса #создание_ииагента_для_бизнеса #api #api_нейросетей

  14. Об организации труда ИИ-агентов

    С осени прошлого года идет стремительный переход от использования ИИ в качестве личного помощника к встраиванию ИИ-агентов в команду и передачи им определенных задач – переход от вайбкодинга к agentic engineering . Задача, как это часто бывает, решается экспериментально, методом проб и ошибок, потому что организовывать разделение труда даже между людьми в команде тимлидов, да и большинство руководителей следующих уровней не учили. А в случае ИИ-агентом ситуация осложняется тем, что это – не просто онбординг способного новичка, который не знает контекста проекта: у этого новичка есть набор сильных сторон, таких как быстрый доступ к знаниям из любых предметных областей, бесконфликтность и готовность к исправлению ошибок, в сочетании со слабыми сторонами, например, склонности упрощать задачу или пользоваться первым попавшимся попсовым знанием вместо профессионального. Если сравнивать с людьми, ИИ-агент – это звезда с особенностями. Встроить звезду в команду, чтобы сильные стороны проявлялись, а слабые не мешали – задача повышенной сложности для любого руководителя. А сейчас ее надо решать массово. Поэтому полезно представлять прошлый опыт перестройки систем разделения труда, а также теорию, которая уже наработана в менеджменте по поводу организации разделения труда. Обзору этого и посвящена статья. Отмечу, что в статье именно теоретический материал, а не практические кейсы. Однако, в конце статьи – ссылки на большое количество выступлений, которые я слышал на конференциях за последние полгода, и по которым у меня есть конспекты. На сайтах конференций для большинства из них опубликованы презентации, а для части уже опубликована запись, при этом их количество постоянно увеличивается, так что если выступление вас заинтересовало, то не поленитесь поискать видео.

    habr.com/ru/articles/1035522/

    #ииагенты #организация_процессов #менеджмент

  15. Об организации труда ИИ-агентов

    С осени прошлого года идет стремительный переход от использования ИИ в качестве личного помощника к встраиванию ИИ-агентов в команду и передачи им определенных задач – переход от вайбкодинга к agentic engineering . Задача, как это часто бывает, решается экспериментально, методом проб и ошибок, потому что организовывать разделение труда даже между людьми в команде тимлидов, да и большинство руководителей следующих уровней не учили. А в случае ИИ-агентом ситуация осложняется тем, что это – не просто онбординг способного новичка, который не знает контекста проекта: у этого новичка есть набор сильных сторон, таких как быстрый доступ к знаниям из любых предметных областей, бесконфликтность и готовность к исправлению ошибок, в сочетании со слабыми сторонами, например, склонности упрощать задачу или пользоваться первым попавшимся попсовым знанием вместо профессионального. Если сравнивать с людьми, ИИ-агент – это звезда с особенностями. Встроить звезду в команду, чтобы сильные стороны проявлялись, а слабые не мешали – задача повышенной сложности для любого руководителя. А сейчас ее надо решать массово. Поэтому полезно представлять прошлый опыт перестройки систем разделения труда, а также теорию, которая уже наработана в менеджменте по поводу организации разделения труда. Обзору этого и посвящена статья. Отмечу, что в статье именно теоретический материал, а не практические кейсы. Однако, в конце статьи – ссылки на большое количество выступлений, которые я слышал на конференциях за последние полгода, и по которым у меня есть конспекты. На сайтах конференций для большинства из них опубликованы презентации, а для части уже опубликована запись, при этом их количество постоянно увеличивается, так что если выступление вас заинтересовало, то не поленитесь поискать видео.

    habr.com/ru/articles/1035522/

    #ииагенты #организация_процессов #менеджмент

  16. Об организации труда ИИ-агентов

    С осени прошлого года идет стремительный переход от использования ИИ в качестве личного помощника к встраиванию ИИ-агентов в команду и передачи им определенных задач – переход от вайбкодинга к agentic engineering . Задача, как это часто бывает, решается экспериментально, методом проб и ошибок, потому что организовывать разделение труда даже между людьми в команде тимлидов, да и большинство руководителей следующих уровней не учили. А в случае ИИ-агентом ситуация осложняется тем, что это – не просто онбординг способного новичка, который не знает контекста проекта: у этого новичка есть набор сильных сторон, таких как быстрый доступ к знаниям из любых предметных областей, бесконфликтность и готовность к исправлению ошибок, в сочетании со слабыми сторонами, например, склонности упрощать задачу или пользоваться первым попавшимся попсовым знанием вместо профессионального. Если сравнивать с людьми, ИИ-агент – это звезда с особенностями. Встроить звезду в команду, чтобы сильные стороны проявлялись, а слабые не мешали – задача повышенной сложности для любого руководителя. А сейчас ее надо решать массово. Поэтому полезно представлять прошлый опыт перестройки систем разделения труда, а также теорию, которая уже наработана в менеджменте по поводу организации разделения труда. Обзору этого и посвящена статья. Отмечу, что в статье именно теоретический материал, а не практические кейсы. Однако, в конце статьи – ссылки на большое количество выступлений, которые я слышал на конференциях за последние полгода, и по которым у меня есть конспекты. На сайтах конференций для большинства из них опубликованы презентации, а для части уже опубликована запись, при этом их количество постоянно увеличивается, так что если выступление вас заинтересовало, то не поленитесь поискать видео.

    habr.com/ru/articles/1035522/

    #ииагенты #организация_процессов #менеджмент

  17. Об организации труда ИИ-агентов

    С осени прошлого года идет стремительный переход от использования ИИ в качестве личного помощника к встраиванию ИИ-агентов в команду и передачи им определенных задач – переход от вайбкодинга к agentic engineering . Задача, как это часто бывает, решается экспериментально, методом проб и ошибок, потому что организовывать разделение труда даже между людьми в команде тимлидов, да и большинство руководителей следующих уровней не учили. А в случае ИИ-агентом ситуация осложняется тем, что это – не просто онбординг способного новичка, который не знает контекста проекта: у этого новичка есть набор сильных сторон, таких как быстрый доступ к знаниям из любых предметных областей, бесконфликтность и готовность к исправлению ошибок, в сочетании со слабыми сторонами, например, склонности упрощать задачу или пользоваться первым попавшимся попсовым знанием вместо профессионального. Если сравнивать с людьми, ИИ-агент – это звезда с особенностями. Встроить звезду в команду, чтобы сильные стороны проявлялись, а слабые не мешали – задача повышенной сложности для любого руководителя. А сейчас ее надо решать массово. Поэтому полезно представлять прошлый опыт перестройки систем разделения труда, а также теорию, которая уже наработана в менеджменте по поводу организации разделения труда. Обзору этого и посвящена статья. Отмечу, что в статье именно теоретический материал, а не практические кейсы. Однако, в конце статьи – ссылки на большое количество выступлений, которые я слышал на конференциях за последние полгода, и по которым у меня есть конспекты. На сайтах конференций для большинства из них опубликованы презентации, а для части уже опубликована запись, при этом их количество постоянно увеличивается, так что если выступление вас заинтересовало, то не поленитесь поискать видео.

    habr.com/ru/articles/1035522/

    #ииагенты #организация_процессов #менеджмент

  18. Что такое MCP. Как работает киллер-фича современности под капотом

    Помните время, когда искусственный интеллект был простой говорящей головой? Мы все через это проходили: открываешь чат, просишь ИИ написать кусок кода, копируешь его, вставляешь в IDE, ловишь ошибку компиляции, копируешь текст ошибки, вставляешь обратно в чат. Рутина. Сплошная, выматывающая рутина. Хочешь, чтобы ИИ прочитал лог-файл? Пиши кастомный плагин. Хочешь, чтобы он сделал простой запрос в базу данных? Садись и пиши очередной адаптер. Каждая новая интеграция требовала написания отдельного, уникального кода. По сути, приходилось соединять зоопарк различных ИИ-моделей с бесконечным множеством баз данных, API и сервисов, собирая костыльные решения на ходу. И так продолжалось бы еще долго, если бы не одно событие. Но 25 ноября 2024 года компания Anthropic представила Model Context Protocol (MCP) . И, честно говоря, это событие полностью изменило правила игры.

    habr.com/ru/companies/bothub/a

    #mcp #mcpserver #что_такое_mcp #как_работает_mcp #model_context_protocol #искусственный_интеллект #ии #ииагенты #ai #aiагенты

  19. Что такое MCP. Как работает киллер-фича современности под капотом

    Помните время, когда искусственный интеллект был простой говорящей головой? Мы все через это проходили: открываешь чат, просишь ИИ написать кусок кода, копируешь его, вставляешь в IDE, ловишь ошибку компиляции, копируешь текст ошибки, вставляешь обратно в чат. Рутина. Сплошная, выматывающая рутина. Хочешь, чтобы ИИ прочитал лог-файл? Пиши кастомный плагин. Хочешь, чтобы он сделал простой запрос в базу данных? Садись и пиши очередной адаптер. Каждая новая интеграция требовала написания отдельного, уникального кода. По сути, приходилось соединять зоопарк различных ИИ-моделей с бесконечным множеством баз данных, API и сервисов, собирая костыльные решения на ходу. И так продолжалось бы еще долго, если бы не одно событие. Но 25 ноября 2024 года компания Anthropic представила Model Context Protocol (MCP) . И, честно говоря, это событие полностью изменило правила игры.

    habr.com/ru/companies/bothub/a

    #mcp #mcpserver #что_такое_mcp #как_работает_mcp #model_context_protocol #искусственный_интеллект #ии #ииагенты #ai #aiагенты

  20. Что такое MCP. Как работает киллер-фича современности под капотом

    Помните время, когда искусственный интеллект был простой говорящей головой? Мы все через это проходили: открываешь чат, просишь ИИ написать кусок кода, копируешь его, вставляешь в IDE, ловишь ошибку компиляции, копируешь текст ошибки, вставляешь обратно в чат. Рутина. Сплошная, выматывающая рутина. Хочешь, чтобы ИИ прочитал лог-файл? Пиши кастомный плагин. Хочешь, чтобы он сделал простой запрос в базу данных? Садись и пиши очередной адаптер. Каждая новая интеграция требовала написания отдельного, уникального кода. По сути, приходилось соединять зоопарк различных ИИ-моделей с бесконечным множеством баз данных, API и сервисов, собирая костыльные решения на ходу. И так продолжалось бы еще долго, если бы не одно событие. Но 25 ноября 2024 года компания Anthropic представила Model Context Protocol (MCP) . И, честно говоря, это событие полностью изменило правила игры.

    habr.com/ru/companies/bothub/a

    #mcp #mcpserver #что_такое_mcp #как_работает_mcp #model_context_protocol #искусственный_интеллект #ии #ииагенты #ai #aiагенты

  21. Что такое MCP. Как работает киллер-фича современности под капотом

    Помните время, когда искусственный интеллект был простой говорящей головой? Мы все через это проходили: открываешь чат, просишь ИИ написать кусок кода, копируешь его, вставляешь в IDE, ловишь ошибку компиляции, копируешь текст ошибки, вставляешь обратно в чат. Рутина. Сплошная, выматывающая рутина. Хочешь, чтобы ИИ прочитал лог-файл? Пиши кастомный плагин. Хочешь, чтобы он сделал простой запрос в базу данных? Садись и пиши очередной адаптер. Каждая новая интеграция требовала написания отдельного, уникального кода. По сути, приходилось соединять зоопарк различных ИИ-моделей с бесконечным множеством баз данных, API и сервисов, собирая костыльные решения на ходу. И так продолжалось бы еще долго, если бы не одно событие. Но 25 ноября 2024 года компания Anthropic представила Model Context Protocol (MCP) . И, честно говоря, это событие полностью изменило правила игры.

    habr.com/ru/companies/bothub/a

    #mcp #mcpserver #что_такое_mcp #как_работает_mcp #model_context_protocol #искусственный_интеллект #ии #ииагенты #ai #aiагенты

  22. Обзор российских ИИ-платформ корпоративного уровня: изучаем архитектуру SimpleOne GenAI, BPMSoft AI, ELMA Cortex

    В 2026-м я наблюдаю любопытную картину у клиентов. Пилоты с ИИ прошли почти у всех — кто-то прикрутил GigaChat к Service Desk, кто-то сделал HR-бота на коленке, кто-то OCR-распознавалку счетов. Вау-эффект на демо был. А в продакшене — три-четыре разрозненных решения, никто не понимает, сколько компания тратит на токены, и СБ уже принесла пачку отчётов про сотрудников, льющих ТЗ в публичный ChatGPT. Это и есть «фаза отрезвления», про которую сейчас пишут McKinsey и Gartner: проблема ИИ — не в моделях, а в том, чтобы перевести их из эксперимента в управляемую инфраструктуру. По сути, это запрос на отдельный класс решений — корпоративные GenAI-платформы . Ниже — разбор трёх российских платформ, которые я для себя считаю наиболее показательными в этом сегменте:

    habr.com/ru/companies/simpleon

    #simpleone #genaiплатформа #ииагенты #GenAI #Agentic_AI #rag

  23. Обзор российских ИИ-платформ корпоративного уровня: изучаем архитектуру SimpleOne GenAI, BPMSoft AI, ELMA Cortex

    В 2026-м я наблюдаю любопытную картину у клиентов. Пилоты с ИИ прошли почти у всех — кто-то прикрутил GigaChat к Service Desk, кто-то сделал HR-бота на коленке, кто-то OCR-распознавалку счетов. Вау-эффект на демо был. А в продакшене — три-четыре разрозненных решения, никто не понимает, сколько компания тратит на токены, и СБ уже принесла пачку отчётов про сотрудников, льющих ТЗ в публичный ChatGPT. Это и есть «фаза отрезвления», про которую сейчас пишут McKinsey и Gartner: проблема ИИ — не в моделях, а в том, чтобы перевести их из эксперимента в управляемую инфраструктуру. По сути, это запрос на отдельный класс решений — корпоративные GenAI-платформы . Ниже — разбор трёх российских платформ, которые я для себя считаю наиболее показательными в этом сегменте:

    habr.com/ru/companies/simpleon

    #simpleone #genaiплатформа #ииагенты #GenAI #Agentic_AI #rag

  24. Обзор российских ИИ-платформ корпоративного уровня: изучаем архитектуру SimpleOne GenAI, BPMSoft AI, ELMA Cortex

    В 2026-м я наблюдаю любопытную картину у клиентов. Пилоты с ИИ прошли почти у всех — кто-то прикрутил GigaChat к Service Desk, кто-то сделал HR-бота на коленке, кто-то OCR-распознавалку счетов. Вау-эффект на демо был. А в продакшене — три-четыре разрозненных решения, никто не понимает, сколько компания тратит на токены, и СБ уже принесла пачку отчётов про сотрудников, льющих ТЗ в публичный ChatGPT. Это и есть «фаза отрезвления», про которую сейчас пишут McKinsey и Gartner: проблема ИИ — не в моделях, а в том, чтобы перевести их из эксперимента в управляемую инфраструктуру. По сути, это запрос на отдельный класс решений — корпоративные GenAI-платформы . Ниже — разбор трёх российских платформ, которые я для себя считаю наиболее показательными в этом сегменте:

    habr.com/ru/companies/simpleon

    #simpleone #genaiплатформа #ииагенты #GenAI #Agentic_AI #rag

  25. Обзор российских ИИ-платформ корпоративного уровня: изучаем архитектуру SimpleOne GenAI, BPMSoft AI, ELMA Cortex

    В 2026-м я наблюдаю любопытную картину у клиентов. Пилоты с ИИ прошли почти у всех — кто-то прикрутил GigaChat к Service Desk, кто-то сделал HR-бота на коленке, кто-то OCR-распознавалку счетов. Вау-эффект на демо был. А в продакшене — три-четыре разрозненных решения, никто не понимает, сколько компания тратит на токены, и СБ уже принесла пачку отчётов про сотрудников, льющих ТЗ в публичный ChatGPT. Это и есть «фаза отрезвления», про которую сейчас пишут McKinsey и Gartner: проблема ИИ — не в моделях, а в том, чтобы перевести их из эксперимента в управляемую инфраструктуру. По сути, это запрос на отдельный класс решений — корпоративные GenAI-платформы . Ниже — разбор трёх российских платформ, которые я для себя считаю наиболее показательными в этом сегменте:

    habr.com/ru/companies/simpleon

    #simpleone #genaiплатформа #ииагенты #GenAI #Agentic_AI #rag

  26. Инженерия качества: Как перестать надеяться на удачу и начать измерять своих ИИ-агентов [Часть 3]

    Продолжаем рассмотрение, того как правильно оценивать качество ИИ систем, в данной части поговорим про метрики характерные для RAG системы. Способах оценить полноту, точность и соответствия выдачи контексту в подобной системе. На примере библиотеки RAGAS, с разбором того, как эти метрики работают изнутри.

    habr.com/ru/articles/1035300/

    #искусственный_интеллект #качество_продукта #обработка_естественного_языка #ragas #rag #ииагенты

  27. Инженерия качества: Как перестать надеяться на удачу и начать измерять своих ИИ-агентов [Часть 3]

    Продолжаем рассмотрение, того как правильно оценивать качество ИИ систем, в данной части поговорим про метрики характерные для RAG системы. Способах оценить полноту, точность и соответствия выдачи контексту в подобной системе. На примере библиотеки RAGAS, с разбором того, как эти метрики работают изнутри.

    habr.com/ru/articles/1035300/

    #искусственный_интеллект #качество_продукта #обработка_естественного_языка #ragas #rag #ииагенты

  28. Инженерия качества: Как перестать надеяться на удачу и начать измерять своих ИИ-агентов [Часть 3]

    Продолжаем рассмотрение, того как правильно оценивать качество ИИ систем, в данной части поговорим про метрики характерные для RAG системы. Способах оценить полноту, точность и соответствия выдачи контексту в подобной системе. На примере библиотеки RAGAS, с разбором того, как эти метрики работают изнутри.

    habr.com/ru/articles/1035300/

    #искусственный_интеллект #качество_продукта #обработка_естественного_языка #ragas #rag #ииагенты

  29. Инженерия качества: Как перестать надеяться на удачу и начать измерять своих ИИ-агентов [Часть 3]

    Продолжаем рассмотрение, того как правильно оценивать качество ИИ систем, в данной части поговорим про метрики характерные для RAG системы. Способах оценить полноту, точность и соответствия выдачи контексту в подобной системе. На примере библиотеки RAGAS, с разбором того, как эти метрики работают изнутри.

    habr.com/ru/articles/1035300/

    #искусственный_интеллект #качество_продукта #обработка_естественного_языка #ragas #rag #ииагенты

  30. ИИ-агенты в проде: как измерить безопасность и снизить риски внедрения

    Недоверие бизнеса к агентным решениям растёт пропорционально их распространению. И это недоверие небезосновательно: агент — это не просто чат-бот с улучшенным промптом. Это система с доступом к инструментам, внешним сервисам и корпоративным данным. Ошибка модели в изолированном чате — это неловкость. Ошибка агента с доступом к почте и документам — это потенциальная утечка данных, репутационный или финансовый инцидент. Эта статья адресована бэкенд-разработчикам, которые уже выкатили агента в прод или готовятся это сделать. Она является практическим продолжением нашего предыдущего материала о Red Teaming LLM : там мы разобрали концептуальную базу и объяснили, почему языковые модели требуют отдельного подхода к тестированию безопасности. Здесь — конкретный кейс из реальной практики

    habr.com/ru/companies/doubleta

    #red_teaming #ииагенты #ииассистент #иимодель #ии_агенты #безопасность #безопасность_данных #кибербезопасность

  31. ИИ-агенты в проде: как измерить безопасность и снизить риски внедрения

    Недоверие бизнеса к агентным решениям растёт пропорционально их распространению. И это недоверие небезосновательно: агент — это не просто чат-бот с улучшенным промптом. Это система с доступом к инструментам, внешним сервисам и корпоративным данным. Ошибка модели в изолированном чате — это неловкость. Ошибка агента с доступом к почте и документам — это потенциальная утечка данных, репутационный или финансовый инцидент. Эта статья адресована бэкенд-разработчикам, которые уже выкатили агента в прод или готовятся это сделать. Она является практическим продолжением нашего предыдущего материала о Red Teaming LLM : там мы разобрали концептуальную базу и объяснили, почему языковые модели требуют отдельного подхода к тестированию безопасности. Здесь — конкретный кейс из реальной практики

    habr.com/ru/companies/doubleta

    #red_teaming #ииагенты #ииассистент #иимодель #ии_агенты #безопасность #безопасность_данных #кибербезопасность

  32. ИИ-агенты в проде: как измерить безопасность и снизить риски внедрения

    Недоверие бизнеса к агентным решениям растёт пропорционально их распространению. И это недоверие небезосновательно: агент — это не просто чат-бот с улучшенным промптом. Это система с доступом к инструментам, внешним сервисам и корпоративным данным. Ошибка модели в изолированном чате — это неловкость. Ошибка агента с доступом к почте и документам — это потенциальная утечка данных, репутационный или финансовый инцидент. Эта статья адресована бэкенд-разработчикам, которые уже выкатили агента в прод или готовятся это сделать. Она является практическим продолжением нашего предыдущего материала о Red Teaming LLM : там мы разобрали концептуальную базу и объяснили, почему языковые модели требуют отдельного подхода к тестированию безопасности. Здесь — конкретный кейс из реальной практики

    habr.com/ru/companies/doubleta

    #red_teaming #ииагенты #ииассистент #иимодель #ии_агенты #безопасность #безопасность_данных #кибербезопасность

  33. ИИ-агенты в проде: как измерить безопасность и снизить риски внедрения

    Недоверие бизнеса к агентным решениям растёт пропорционально их распространению. И это недоверие небезосновательно: агент — это не просто чат-бот с улучшенным промптом. Это система с доступом к инструментам, внешним сервисам и корпоративным данным. Ошибка модели в изолированном чате — это неловкость. Ошибка агента с доступом к почте и документам — это потенциальная утечка данных, репутационный или финансовый инцидент. Эта статья адресована бэкенд-разработчикам, которые уже выкатили агента в прод или готовятся это сделать. Она является практическим продолжением нашего предыдущего материала о Red Teaming LLM : там мы разобрали концептуальную базу и объяснили, почему языковые модели требуют отдельного подхода к тестированию безопасности. Здесь — конкретный кейс из реальной практики

    habr.com/ru/companies/doubleta

    #red_teaming #ииагенты #ииассистент #иимодель #ии_агенты #безопасность #безопасность_данных #кибербезопасность

  34. Ищем самый быстрый XML парсер для Apple платформы с помощью ИИ

    Нет, это не déjà vu, это продолжение моей прошлой статьи Самый быстрый XML парсер для iOS в 2026 году? Чтобы вам не тратить время на ее чтение, вот краткий пересказ. В прошлой статье происходит поиск самого быстрого XML парсера со следующими характиристиками: Для Apple платформы (iOS, tvOS, macOS) Язык Objective-C или Swift GitHub как источник исходников Популярный (хотя бы больше 500 звезд) Любая интеграция (CocoaPods, SwiftPM) И самое важное, весь бенчмарк я писал сам с небольшой помощью ИИ, не спеша, под несколько чашечек кофе за 3 часа я нашел нужный мне XML парсер. Спустя пару месяцев после выхода первой статьи, мне пришла мысль, зачем я тратил 3 часа на эту задачу, если можно было просто это самое задание “скормить” ИИшке и она бы за 5 минут решила бы ее (так пишут в интернетах). Тут же пришла вторая идея. Так как у меня есть мною лично проверенный результат, то я могу загрузить этой задачей все популярные ИИ и их результаты сравнить со своим. Даже не исключаю, что у меня где-то есть ошибка и тогда рейтинг парсеров будет выглядеть совсем иначе и я выбрал не самый быстрый как хотел. Собственно, что я и сделал. Загнал задачу в топ 15 ИИ и сравнил их результаты со своим. Если вам интересно, кто справился с задачей, кто спасовал, будет описано в развернутой статье под катом. Для затравки, наихудший результат и последнее место занимает GPT 5.5 Pro. А Claude Opus 4.7 не смог взять первое место.

    habr.com/ru/articles/1035210/

    #ииагенты #swift #xcode #claude #gpt #gemini

  35. Ищем самый быстрый XML парсер для Apple платформы с помощью ИИ

    Нет, это не déjà vu, это продолжение моей прошлой статьи Самый быстрый XML парсер для iOS в 2026 году? Чтобы вам не тратить время на ее чтение, вот краткий пересказ. В прошлой статье происходит поиск самого быстрого XML парсера со следующими характиристиками: Для Apple платформы (iOS, tvOS, macOS) Язык Objective-C или Swift GitHub как источник исходников Популярный (хотя бы больше 500 звезд) Любая интеграция (CocoaPods, SwiftPM) И самое важное, весь бенчмарк я писал сам с небольшой помощью ИИ, не спеша, под несколько чашечек кофе за 3 часа я нашел нужный мне XML парсер. Спустя пару месяцев после выхода первой статьи, мне пришла мысль, зачем я тратил 3 часа на эту задачу, если можно было просто это самое задание “скормить” ИИшке и она бы за 5 минут решила бы ее (так пишут в интернетах). Тут же пришла вторая идея. Так как у меня есть мною лично проверенный результат, то я могу загрузить этой задачей все популярные ИИ и их результаты сравнить со своим. Даже не исключаю, что у меня где-то есть ошибка и тогда рейтинг парсеров будет выглядеть совсем иначе и я выбрал не самый быстрый как хотел. Собственно, что я и сделал. Загнал задачу в топ 15 ИИ и сравнил их результаты со своим. Если вам интересно, кто справился с задачей, кто спасовал, будет описано в развернутой статье под катом. Для затравки, наихудший результат и последнее место занимает GPT 5.5 Pro. А Claude Opus 4.7 не смог взять первое место.

    habr.com/ru/articles/1035210/

    #ииагенты #swift #xcode #claude #gpt #gemini

  36. Ищем самый быстрый XML парсер для Apple платформы с помощью ИИ

    Нет, это не déjà vu, это продолжение моей прошлой статьи Самый быстрый XML парсер для iOS в 2026 году? Чтобы вам не тратить время на ее чтение, вот краткий пересказ. В прошлой статье происходит поиск самого быстрого XML парсера со следующими характиристиками: Для Apple платформы (iOS, tvOS, macOS) Язык Objective-C или Swift GitHub как источник исходников Популярный (хотя бы больше 500 звезд) Любая интеграция (CocoaPods, SwiftPM) И самое важное, весь бенчмарк я писал сам с небольшой помощью ИИ, не спеша, под несколько чашечек кофе за 3 часа я нашел нужный мне XML парсер. Спустя пару месяцев после выхода первой статьи, мне пришла мысль, зачем я тратил 3 часа на эту задачу, если можно было просто это самое задание “скормить” ИИшке и она бы за 5 минут решила бы ее (так пишут в интернетах). Тут же пришла вторая идея. Так как у меня есть мною лично проверенный результат, то я могу загрузить этой задачей все популярные ИИ и их результаты сравнить со своим. Даже не исключаю, что у меня где-то есть ошибка и тогда рейтинг парсеров будет выглядеть совсем иначе и я выбрал не самый быстрый как хотел. Собственно, что я и сделал. Загнал задачу в топ 15 ИИ и сравнил их результаты со своим. Если вам интересно, кто справился с задачей, кто спасовал, будет описано в развернутой статье под катом. Для затравки, наихудший результат и последнее место занимает GPT 5.5 Pro. А Claude Opus 4.7 не смог взять первое место.

    habr.com/ru/articles/1035210/

    #ииагенты #swift #xcode #claude #gpt #gemini

  37. Ищем самый быстрый XML парсер для Apple платформы с помощью ИИ

    Нет, это не déjà vu, это продолжение моей прошлой статьи Самый быстрый XML парсер для iOS в 2026 году? Чтобы вам не тратить время на ее чтение, вот краткий пересказ. В прошлой статье происходит поиск самого быстрого XML парсера со следующими характиристиками: Для Apple платформы (iOS, tvOS, macOS) Язык Objective-C или Swift GitHub как источник исходников Популярный (хотя бы больше 500 звезд) Любая интеграция (CocoaPods, SwiftPM) И самое важное, весь бенчмарк я писал сам с небольшой помощью ИИ, не спеша, под несколько чашечек кофе за 3 часа я нашел нужный мне XML парсер. Спустя пару месяцев после выхода первой статьи, мне пришла мысль, зачем я тратил 3 часа на эту задачу, если можно было просто это самое задание “скормить” ИИшке и она бы за 5 минут решила бы ее (так пишут в интернетах). Тут же пришла вторая идея. Так как у меня есть мною лично проверенный результат, то я могу загрузить этой задачей все популярные ИИ и их результаты сравнить со своим. Даже не исключаю, что у меня где-то есть ошибка и тогда рейтинг парсеров будет выглядеть совсем иначе и я выбрал не самый быстрый как хотел. Собственно, что я и сделал. Загнал задачу в топ 15 ИИ и сравнил их результаты со своим. Если вам интересно, кто справился с задачей, кто спасовал, будет описано в развернутой статье под катом. Для затравки, наихудший результат и последнее место занимает GPT 5.5 Pro. А Claude Opus 4.7 не смог взять первое место.

    habr.com/ru/articles/1035210/

    #ииагенты #swift #xcode #claude #gpt #gemini

  38. Среда агента: контекст, архитектурные границы, память проекта

    Пятая статья из шести про инженерный процесс для разработки с ИИ-агентами. Первая статья про путь от первых проектов к стандарту SENAR. Вторая про то, чем агент отличается от программиста. Третья про новую роль человека и пять навыков нового рабочего режима. Четвёртая про ворота задачи: спецификацию на входе, сверку с критериями на выходе и метрики, которые видят, что в контуре провисло. Эта пятая про среду, в которой задача живёт от постановки до сдачи: контекст под неё, архитектурные границы вокруг и память проекта над всем.

    habr.com/ru/articles/1034788/

    #ииагенты #claude_code #llm #aiразработка #методология_разработки #senar #tausik #контекстинжиниринг #архитектура #инженерные_практики

  39. Среда агента: контекст, архитектурные границы, память проекта

    Пятая статья из шести про инженерный процесс для разработки с ИИ-агентами. Первая статья про путь от первых проектов к стандарту SENAR. Вторая про то, чем агент отличается от программиста. Третья про новую роль человека и пять навыков нового рабочего режима. Четвёртая про ворота задачи: спецификацию на входе, сверку с критериями на выходе и метрики, которые видят, что в контуре провисло. Эта пятая про среду, в которой задача живёт от постановки до сдачи: контекст под неё, архитектурные границы вокруг и память проекта над всем.

    habr.com/ru/articles/1034788/

    #ииагенты #claude_code #llm #aiразработка #методология_разработки #senar #tausik #контекстинжиниринг #архитектура #инженерные_практики

  40. Среда агента: контекст, архитектурные границы, память проекта

    Пятая статья из шести про инженерный процесс для разработки с ИИ-агентами. Первая статья про путь от первых проектов к стандарту SENAR. Вторая про то, чем агент отличается от программиста. Третья про новую роль человека и пять навыков нового рабочего режима. Четвёртая про ворота задачи: спецификацию на входе, сверку с критериями на выходе и метрики, которые видят, что в контуре провисло. Эта пятая про среду, в которой задача живёт от постановки до сдачи: контекст под неё, архитектурные границы вокруг и память проекта над всем.

    habr.com/ru/articles/1034788/

    #ииагенты #claude_code #llm #aiразработка #методология_разработки #senar #tausik #контекстинжиниринг #архитектура #инженерные_практики

  41. Среда агента: контекст, архитектурные границы, память проекта

    Пятая статья из шести про инженерный процесс для разработки с ИИ-агентами. Первая статья про путь от первых проектов к стандарту SENAR. Вторая про то, чем агент отличается от программиста. Третья про новую роль человека и пять навыков нового рабочего режима. Четвёртая про ворота задачи: спецификацию на входе, сверку с критериями на выходе и метрики, которые видят, что в контуре провисло. Эта пятая про среду, в которой задача живёт от постановки до сдачи: контекст под неё, архитектурные границы вокруг и память проекта над всем.

    habr.com/ru/articles/1034788/

    #ииагенты #claude_code #llm #aiразработка #методология_разработки #senar #tausik #контекстинжиниринг #архитектура #инженерные_практики

  42. Вы пустили ИИ-агента в репозиторий, теперь разбираемся, что он может сломать

    В феврале 2026 года Claude Cowork стирает 15 лет семейных фотографий одной командой. За полгода до этого, в августе 2025-го, случился кейс Nx supply chain: малварь впервые в истории использует локальные ИИ-CLI как инструмент разведки. В марте этого года Google Cloud Threat Horizons H1-2026 подтверждает: часть украденных в Nx токенов используется кампанией UNC6426 для перехода CI/CD → cloud admin через злоупотребление OIDC. 72 часа от первого коммита до админских прав в AWS. Всё это примеры того, что может происходить, когда у ИИ-агента есть руки и мы забываем, на чьей машине эти руки действуют. Данная статья предназначается для неравнодушных инженеров, AppSec, DevSecOps специалистов и всех тех, кто хоть раз запускал агента у себя на машине. Запрещать агентов в контуре бесполезно, отказываться от них самому глупо, но чем они так опасны? Сперва развеем туман неясности, построим модель угроз, собранную на реальных инцидентах и опубликованных CVE, а после будут конкретные рекомендации, как ограничить агента песочницей без ущерба для эффективности разработки. И как запускать --dangerously-skip-permissions без страха.

    habr.com/ru/companies/pt/artic

    #ИИагенты #безопасность #OWASP #supply_chain #Claude_Code #prompt_injection #DevSecOps

  43. Вы пустили ИИ-агента в репозиторий, теперь разбираемся, что он может сломать

    В феврале 2026 года Claude Cowork стирает 15 лет семейных фотографий одной командой. За полгода до этого, в августе 2025-го, случился кейс Nx supply chain: малварь впервые в истории использует локальные ИИ-CLI как инструмент разведки. В марте этого года Google Cloud Threat Horizons H1-2026 подтверждает: часть украденных в Nx токенов используется кампанией UNC6426 для перехода CI/CD → cloud admin через злоупотребление OIDC. 72 часа от первого коммита до админских прав в AWS. Всё это примеры того, что может происходить, когда у ИИ-агента есть руки и мы забываем, на чьей машине эти руки действуют. Данная статья предназначается для неравнодушных инженеров, AppSec, DevSecOps специалистов и всех тех, кто хоть раз запускал агента у себя на машине. Запрещать агентов в контуре бесполезно, отказываться от них самому глупо, но чем они так опасны? Сперва развеем туман неясности, построим модель угроз, собранную на реальных инцидентах и опубликованных CVE, а после будут конкретные рекомендации, как ограничить агента песочницей без ущерба для эффективности разработки. И как запускать --dangerously-skip-permissions без страха.

    habr.com/ru/companies/pt/artic

    #ИИагенты #безопасность #OWASP #supply_chain #Claude_Code #prompt_injection #DevSecOps

  44. Вы пустили ИИ-агента в репозиторий, теперь разбираемся, что он может сломать

    В феврале 2026 года Claude Cowork стирает 15 лет семейных фотографий одной командой. За полгода до этого, в августе 2025-го, случился кейс Nx supply chain: малварь впервые в истории использует локальные ИИ-CLI как инструмент разведки. В марте этого года Google Cloud Threat Horizons H1-2026 подтверждает: часть украденных в Nx токенов используется кампанией UNC6426 для перехода CI/CD → cloud admin через злоупотребление OIDC. 72 часа от первого коммита до админских прав в AWS. Всё это примеры того, что может происходить, когда у ИИ-агента есть руки и мы забываем, на чьей машине эти руки действуют. Данная статья предназначается для неравнодушных инженеров, AppSec, DevSecOps специалистов и всех тех, кто хоть раз запускал агента у себя на машине. Запрещать агентов в контуре бесполезно, отказываться от них самому глупо, но чем они так опасны? Сперва развеем туман неясности, построим модель угроз, собранную на реальных инцидентах и опубликованных CVE, а после будут конкретные рекомендации, как ограничить агента песочницей без ущерба для эффективности разработки. И как запускать --dangerously-skip-permissions без страха.

    habr.com/ru/companies/pt/artic

    #ИИагенты #безопасность #OWASP #supply_chain #Claude_Code #prompt_injection #DevSecOps

  45. Вы пустили ИИ-агента в репозиторий, теперь разбираемся, что он может сломать

    В феврале 2026 года Claude Cowork стирает 15 лет семейных фотографий одной командой. За полгода до этого, в августе 2025-го, случился кейс Nx supply chain: малварь впервые в истории использует локальные ИИ-CLI как инструмент разведки. В марте этого года Google Cloud Threat Horizons H1-2026 подтверждает: часть украденных в Nx токенов используется кампанией UNC6426 для перехода CI/CD → cloud admin через злоупотребление OIDC. 72 часа от первого коммита до админских прав в AWS. Всё это примеры того, что может происходить, когда у ИИ-агента есть руки и мы забываем, на чьей машине эти руки действуют. Данная статья предназначается для неравнодушных инженеров, AppSec, DevSecOps специалистов и всех тех, кто хоть раз запускал агента у себя на машине. Запрещать агентов в контуре бесполезно, отказываться от них самому глупо, но чем они так опасны? Сперва развеем туман неясности, построим модель угроз, собранную на реальных инцидентах и опубликованных CVE, а после будут конкретные рекомендации, как ограничить агента песочницей без ущерба для эффективности разработки. И как запускать --dangerously-skip-permissions без страха.

    habr.com/ru/companies/pt/artic

    #ИИагенты #безопасность #OWASP #supply_chain #Claude_Code #prompt_injection #DevSecOps

  46. [Перевод] Создание MCP‑серверов на FastMCP: 7 ошибок, которых стоит избегать

    FastMCP позволяет быстро собрать MCP‑сервер, но скорость легко оборачивается ошибками: лишние токены, слабые схемы, сырые API‑примитивы, плохая обработка ошибок и риски безопасности. В статье разбираем 7 проблем, из‑за которых LLM‑агент начинает путаться, ломать сценарии и требовать лишних подтверждений, — и показываем, как их исправить.

    habr.com/ru/companies/otus/art

    #MCP #FastMCP #ИИагенты #LLM #Python #API #безопасность #обработка_ошибок #токены #проектирование_инструментов

  47. AI-рекрутер, который никогда не устает: как мы автоматизировали скрининг кандидатов

    Привет, Хабр! На связи команда Just AI. Мы занимаемся разработкой AI-агентов, и в какой-то момент решили автоматизировать собственный процесс найма . В итоге сделали агента, который проводит первичный скрининг кандидатов: задает вопросы, оценивает ответы и отправляет рекрутеру письмо с готовым вердиктом. В этой статье разобрали, зачем мы это сделали, как устроена система изнутри, с какими проблемами столкнулись и что получилось в итоге.

    habr.com/ru/companies/just_ai/

    #рекрутинг_в_it #ai_agents #автоматизация_найма #hr_автоматизация #ииагенты #ииагенты_для_бизнеса #чатботы #чат_на_сайт #ai #мультиагентные_системы

  48. [Перевод] Создание MCP‑серверов на FastMCP: 7 ошибок, которых стоит избегать

    FastMCP позволяет быстро собрать MCP‑сервер, но скорость легко оборачивается ошибками: лишние токены, слабые схемы, сырые API‑примитивы, плохая обработка ошибок и риски безопасности. В статье разбираем 7 проблем, из‑за которых LLM‑агент начинает путаться, ломать сценарии и требовать лишних подтверждений, — и показываем, как их исправить.

    habr.com/ru/companies/otus/art

    #MCP #FastMCP #ИИагенты #LLM #Python #API #безопасность #обработка_ошибок #токены #проектирование_инструментов

  49. AI-рекрутер, который никогда не устает: как мы автоматизировали скрининг кандидатов

    Привет, Хабр! На связи команда Just AI. Мы занимаемся разработкой AI-агентов, и в какой-то момент решили автоматизировать собственный процесс найма . В итоге сделали агента, который проводит первичный скрининг кандидатов: задает вопросы, оценивает ответы и отправляет рекрутеру письмо с готовым вердиктом. В этой статье разобрали, зачем мы это сделали, как устроена система изнутри, с какими проблемами столкнулись и что получилось в итоге.

    habr.com/ru/companies/just_ai/

    #рекрутинг_в_it #ai_agents #автоматизация_найма #hr_автоматизация #ииагенты #ииагенты_для_бизнеса #чатботы #чат_на_сайт #ai #мультиагентные_системы

  50. [Перевод] Создание MCP‑серверов на FastMCP: 7 ошибок, которых стоит избегать

    FastMCP позволяет быстро собрать MCP‑сервер, но скорость легко оборачивается ошибками: лишние токены, слабые схемы, сырые API‑примитивы, плохая обработка ошибок и риски безопасности. В статье разбираем 7 проблем, из‑за которых LLM‑агент начинает путаться, ломать сценарии и требовать лишних подтверждений, — и показываем, как их исправить.

    habr.com/ru/companies/otus/art

    #MCP #FastMCP #ИИагенты #LLM #Python #API #безопасность #обработка_ошибок #токены #проектирование_инструментов

  51. AI-рекрутер, который никогда не устает: как мы автоматизировали скрининг кандидатов

    Привет, Хабр! На связи команда Just AI. Мы занимаемся разработкой AI-агентов, и в какой-то момент решили автоматизировать собственный процесс найма . В итоге сделали агента, который проводит первичный скрининг кандидатов: задает вопросы, оценивает ответы и отправляет рекрутеру письмо с готовым вердиктом. В этой статье разобрали, зачем мы это сделали, как устроена система изнутри, с какими проблемами столкнулись и что получилось в итоге.

    habr.com/ru/companies/just_ai/

    #рекрутинг_в_it #ai_agents #автоматизация_найма #hr_автоматизация #ииагенты #ииагенты_для_бизнеса #чатботы #чат_на_сайт #ai #мультиагентные_системы

  52. [Перевод] Создание MCP‑серверов на FastMCP: 7 ошибок, которых стоит избегать

    FastMCP позволяет быстро собрать MCP‑сервер, но скорость легко оборачивается ошибками: лишние токены, слабые схемы, сырые API‑примитивы, плохая обработка ошибок и риски безопасности. В статье разбираем 7 проблем, из‑за которых LLM‑агент начинает путаться, ломать сценарии и требовать лишних подтверждений, — и показываем, как их исправить.

    habr.com/ru/companies/otus/art

    #MCP #FastMCP #ИИагенты #LLM #Python #API #безопасность #обработка_ошибок #токены #проектирование_инструментов

  53. AI-рекрутер, который никогда не устает: как мы автоматизировали скрининг кандидатов

    Привет, Хабр! На связи команда Just AI. Мы занимаемся разработкой AI-агентов, и в какой-то момент решили автоматизировать собственный процесс найма . В итоге сделали агента, который проводит первичный скрининг кандидатов: задает вопросы, оценивает ответы и отправляет рекрутеру письмо с готовым вердиктом. В этой статье разобрали, зачем мы это сделали, как устроена система изнутри, с какими проблемами столкнулись и что получилось в итоге.

    habr.com/ru/companies/just_ai/

    #рекрутинг_в_it #ai_agents #автоматизация_найма #hr_автоматизация #ииагенты #ииагенты_для_бизнеса #чатботы #чат_на_сайт #ai #мультиагентные_системы

  54. Лучший код занял второе место: разбираем финал Dev-to-Dev хакатона и ищем границы агентной инженерии

    В финале хакатона Dev-to-Dev: Agentic Engineering Challenge на втором месте оказался самый качественно написанный проект соревнования. 65 тестов, типы, защита от path traversal, Docker с non-root user, архитектура, в которой видно инженера, а не участника хакатона. И именно поэтому он не победил. Победителем стал не самый чистый код и не самая смелая архитектура. Это решение точнее всех попало в то, что мы пытались измерить — agentic engineering. Термин, которому едва пара лет, и в который каждая команда пока вкладывает что-то своё. Ниже разбираем 10 финалистов хакатона: что они построили, где заработали баллы и где их потеряли, какие архитектурные ставки сработали — и почему «писать хороший код» и «строить агентные системы» в 2026 году превратились в разные навыки.

    habr.com/ru/articles/1034362/

    #искусственный_интеллект #агентное_программирование #ииагенты #python #mcp #mcpserver #fastmcp #agentic_engineering #docker #claudemd

  55. Лучший код занял второе место: разбираем финал Dev-to-Dev хакатона и ищем границы агентной инженерии

    В финале хакатона Dev-to-Dev: Agentic Engineering Challenge на втором месте оказался самый качественно написанный проект соревнования. 65 тестов, типы, защита от path traversal, Docker с non-root user, архитектура, в которой видно инженера, а не участника хакатона. И именно поэтому он не победил. Победителем стал не самый чистый код и не самая смелая архитектура. Это решение точнее всех попало в то, что мы пытались измерить — agentic engineering. Термин, которому едва пара лет, и в который каждая команда пока вкладывает что-то своё. Ниже разбираем 10 финалистов хакатона: что они построили, где заработали баллы и где их потеряли, какие архитектурные ставки сработали — и почему «писать хороший код» и «строить агентные системы» в 2026 году превратились в разные навыки.

    habr.com/ru/articles/1034362/

    #искусственный_интеллект #агентное_программирование #ииагенты #python #mcp #mcpserver #fastmcp #agentic_engineering #docker #claudemd

  56. Лучший код занял второе место: разбираем финал Dev-to-Dev хакатона и ищем границы агентной инженерии

    В финале хакатона Dev-to-Dev: Agentic Engineering Challenge на втором месте оказался самый качественно написанный проект соревнования. 65 тестов, типы, защита от path traversal, Docker с non-root user, архитектура, в которой видно инженера, а не участника хакатона. И именно поэтому он не победил. Победителем стал не самый чистый код и не самая смелая архитектура. Это решение точнее всех попало в то, что мы пытались измерить — agentic engineering. Термин, которому едва пара лет, и в который каждая команда пока вкладывает что-то своё. Ниже разбираем 10 финалистов хакатона: что они построили, где заработали баллы и где их потеряли, какие архитектурные ставки сработали — и почему «писать хороший код» и «строить агентные системы» в 2026 году превратились в разные навыки.

    habr.com/ru/articles/1034362/

    #искусственный_интеллект #агентное_программирование #ииагенты #python #mcp #mcpserver #fastmcp #agentic_engineering #docker #claudemd

  57. Лучший код занял второе место: разбираем финал Dev-to-Dev хакатона и ищем границы агентной инженерии

    В финале хакатона Dev-to-Dev: Agentic Engineering Challenge на втором месте оказался самый качественно написанный проект соревнования. 65 тестов, типы, защита от path traversal, Docker с non-root user, архитектура, в которой видно инженера, а не участника хакатона. И именно поэтому он не победил. Победителем стал не самый чистый код и не самая смелая архитектура. Это решение точнее всех попало в то, что мы пытались измерить — agentic engineering. Термин, которому едва пара лет, и в который каждая команда пока вкладывает что-то своё. Ниже разбираем 10 финалистов хакатона: что они построили, где заработали баллы и где их потеряли, какие архитектурные ставки сработали — и почему «писать хороший код» и «строить агентные системы» в 2026 году превратились в разные навыки.

    habr.com/ru/articles/1034362/

    #искусственный_интеллект #агентное_программирование #ииагенты #python #mcp #mcpserver #fastmcp #agentic_engineering #docker #claudemd

  58. Как сделать ИИ-агентов безопасными? Разбор архитектуры безопасности агентского ИИ от OpenAI

    Когда агент может сам читать репозитории, выполнять shell-команды и взаимодействовать с инструментами разработки, возникает закономерный вопрос: как обеспечить информ.безопасность? OpenAI опубликовали подробности о том, как они сами у себя внутри работают с агентами. Разберём по частям. Что такое Codex, для тех, кто еще не успел попробовать Codex - это ИИ-агент: он автономно обходит репозитории, запускает команды, дёргает внешние API и инструменты разработчика. Агенты могут работать параллельно, в изолированных копиях кода, а пользователь переключается между задачами, смотрит изменения и забирает результат. Зачастую пользователи создают мультиагентскую среду, не требующую участия человека. Если учесть, что и с человеком дыры в безопасности поражают, то о какой безопасности может идти речь, если агенты имеют вседозволенность в контуре? Именно поэтому у OpenAI сформировался чёткий принцип развёртывания: низкорисковые действия - без остановок, высокорисковые - с проверкой . Слой 1: Песочница и система одобрений Первая линия контроля sandbox. Он определяет техническую границу выполнения, куда Codex может писать, к каким путям имеет доступ, что остаётся защищённым. Поверх sandbox работает политика одобрений: если агент хочет сделать что-то за пределами песочницы, он обязан запросить разрешение. Пользователь может одобрить действие разово или разрешить целый класс действий на сессию. Чтобы агент не превращался в машину по генерации диалогов "разрешить/запретить", OpenAI добавили режим автопроверки ( auto_review ). Это субагент, который запущен рядом и молча одобряет рутинные низкорисковые запросы без прерывания пользователя. Но стоит появиться чему-то нестандартному или потенциально опасному - управление передаётся человеку.

    habr.com/ru/articles/1034304/

    #ииагенты #ии

  59. Как сделать ИИ-агентов безопасными? Разбор архитектуры безопасности агентского ИИ от OpenAI

    Когда агент может сам читать репозитории, выполнять shell-команды и взаимодействовать с инструментами разработки, возникает закономерный вопрос: как обеспечить информ.безопасность? OpenAI опубликовали подробности о том, как они сами у себя внутри работают с агентами. Разберём по частям. Что такое Codex, для тех, кто еще не успел попробовать Codex - это ИИ-агент: он автономно обходит репозитории, запускает команды, дёргает внешние API и инструменты разработчика. Агенты могут работать параллельно, в изолированных копиях кода, а пользователь переключается между задачами, смотрит изменения и забирает результат. Зачастую пользователи создают мультиагентскую среду, не требующую участия человека. Если учесть, что и с человеком дыры в безопасности поражают, то о какой безопасности может идти речь, если агенты имеют вседозволенность в контуре? Именно поэтому у OpenAI сформировался чёткий принцип развёртывания: низкорисковые действия - без остановок, высокорисковые - с проверкой . Слой 1: Песочница и система одобрений Первая линия контроля sandbox. Он определяет техническую границу выполнения, куда Codex может писать, к каким путям имеет доступ, что остаётся защищённым. Поверх sandbox работает политика одобрений: если агент хочет сделать что-то за пределами песочницы, он обязан запросить разрешение. Пользователь может одобрить действие разово или разрешить целый класс действий на сессию. Чтобы агент не превращался в машину по генерации диалогов "разрешить/запретить", OpenAI добавили режим автопроверки ( auto_review ). Это субагент, который запущен рядом и молча одобряет рутинные низкорисковые запросы без прерывания пользователя. Но стоит появиться чему-то нестандартному или потенциально опасному - управление передаётся человеку.

    habr.com/ru/articles/1034304/

    #ииагенты #ии

  60. Как сделать ИИ-агентов безопасными? Разбор архитектуры безопасности агентского ИИ от OpenAI

    Когда агент может сам читать репозитории, выполнять shell-команды и взаимодействовать с инструментами разработки, возникает закономерный вопрос: как обеспечить информ.безопасность? OpenAI опубликовали подробности о том, как они сами у себя внутри работают с агентами. Разберём по частям. Что такое Codex, для тех, кто еще не успел попробовать Codex - это ИИ-агент: он автономно обходит репозитории, запускает команды, дёргает внешние API и инструменты разработчика. Агенты могут работать параллельно, в изолированных копиях кода, а пользователь переключается между задачами, смотрит изменения и забирает результат. Зачастую пользователи создают мультиагентскую среду, не требующую участия человека. Если учесть, что и с человеком дыры в безопасности поражают, то о какой безопасности может идти речь, если агенты имеют вседозволенность в контуре? Именно поэтому у OpenAI сформировался чёткий принцип развёртывания: низкорисковые действия - без остановок, высокорисковые - с проверкой . Слой 1: Песочница и система одобрений Первая линия контроля sandbox. Он определяет техническую границу выполнения, куда Codex может писать, к каким путям имеет доступ, что остаётся защищённым. Поверх sandbox работает политика одобрений: если агент хочет сделать что-то за пределами песочницы, он обязан запросить разрешение. Пользователь может одобрить действие разово или разрешить целый класс действий на сессию. Чтобы агент не превращался в машину по генерации диалогов "разрешить/запретить", OpenAI добавили режим автопроверки ( auto_review ). Это субагент, который запущен рядом и молча одобряет рутинные низкорисковые запросы без прерывания пользователя. Но стоит появиться чему-то нестандартному или потенциально опасному - управление передаётся человеку.

    habr.com/ru/articles/1034304/

    #ииагенты #ии