#aiагенты — Public Fediverse posts
Live and recent posts from across the Fediverse tagged #aiагенты, aggregated by home.social.
-
Собрал оркестратор для Codex на базе Beads и Superpowers — 4 skill, параллельные subagents, наблюдаемость
Я работаю с Codex каждый день и со временем собрал поверх него систему оркестрации: 4 локальных skill (setup, stage, router, closeout), .codex/orchestrator.toml как машинный контракт и обязательная Parallel Decomposition Matrix перед делегированием. Сверху — Beads как трекер задач и Superpowers как процессные skill. Что это даёт на практике: — параллельный запуск независимых streams, когда write zones не пересекаются; — видимые spawned subagents — можно кликнуть и зайти в каждого отдельного агента, полная наблюдаемость; — чистый контекст основного оркестратора: он диспетчер, а не исполнитель, токены тратятся только на координацию; — нулевой silent debt — закрытие этапа требует evidence. История того, как я к этому пришёл — полгода с большим AGENTS.md на 30 КБ, который не работал. Проблема была не в правилах, а в том, что одно полотно правил это не контракт, а эссе. В статье: фрагменты toml, шаблон worker-контракта, golden prompts, грабли с inline-делегированием. Архив со всеми 4 скиллами прикладываю к посту в моём Telegram-канале — можно скачать и поставить себе.
https://habr.com/ru/articles/1037064/
#Codex #AIагенты #OpenAI #оркестрацияагентов #skills #Beads #Superpowers #parallelexecution
-
Агент — это не новый пользователь. Это новый посредник. Что медицина знает об этом 100 лет
На этой неделе прочитала свежую статью Кьяры Пеллегрини из NN/g: «AI-агенты теперь тоже пользователи наших интерфейсов». Автор — серьёзный исследователь, статья хорошо аргументирована. У агента есть цели, агент сталкивается с интерфейсом, агент пытается достичь целей через наш дизайн. По функциональному определению — пользователь. Я не согласна с этой рамкой. И думаю, что разница принципиальная. Восемь лет я работала клиническим врачом, потом перешла в продуктовый дизайн. Сейчас веду UX/UI в крупной российской IT-компании. Этот переход дал мне странное двойное зрение: я постоянно вижу в дизайне проблемы, которые медицина решала десятилетиями. Вопрос с агентами — один из них. Агент — это не новый пользователь. Это новый посредник.
https://habr.com/ru/articles/1036686/
#aiагенты #accessibility #wcag #инклюзивный_дизайн #uxисследования #дизайнсистемы #медицина_и_дизайн #семантическая_разметка #посредники #llm
-
Spring Agent Toolkit: ультимативный набор для вашего AI-агента
AI-агенты уже стали частью повседневной разработки. Сначала это выглядит как магия: формулируешь задачу, получаешь код, тесты, иногда даже готовый PR. Но довольно быстро приходит осознание: – токены улетают слишком быстро; – задача выполняется дольше, чем ожидалось; – результат не всегда совпадает с тем, что было задумано. В этой статье разберем, что с этим можно сделать на практике и почему для хорошего результата критически важен правильно подобранный набор инструментов.
https://habr.com/ru/companies/haulmont/articles/1034688/
#springboot #aiагенты #mcp #skill #jpa #rest #генерация_кода
-
Качество кода в эпоху AI: как не утонуть в багах и уязвимостях
Это конспект вебинара. Спикер — Даниил Степанов, разработчик-исследователь Veai, преподаватель ИТМО, ранее работал в JetBrains и Huawei. AI уже пишет заметную часть промышленного кода, а процессы качества у многих команд остались такими, будто код всё ещё пишет только человек и в прежнем объёме. Если коротко: проблема чаще всего не в том, что "модель тупая". Проблема в том, что вокруг агента нет инженерного контура: спецификации, ограничений, независимых тестов, security-checks, ревью-пайплайна и артефактов, которым можно верить.
https://habr.com/ru/companies/veai/articles/1035778/
#программирование #java #javascript #aiагенты #ai #llmмодели #llmагент #llm #kotlin #kotlin_native
-
Качество кода в эпоху AI: как не утонуть в багах и уязвимостях
Это конспект вебинара. Спикер — Даниил Степанов, разработчик-исследователь Veai, преподаватель ИТМО, ранее работал в JetBrains и Huawei. AI уже пишет заметную часть промышленного кода, а процессы качества у многих команд остались такими, будто код всё ещё пишет только человек и в прежнем объёме. Если коротко: проблема чаще всего не в том, что "модель тупая". Проблема в том, что вокруг агента нет инженерного контура: спецификации, ограничений, независимых тестов, security-checks, ревью-пайплайна и артефактов, которым можно верить.
https://habr.com/ru/companies/veai/articles/1035778/
#программирование #java #javascript #aiагенты #ai #llmмодели #llmагент #llm #kotlin #kotlin_native
-
Качество кода в эпоху AI: как не утонуть в багах и уязвимостях
Это конспект вебинара. Спикер — Даниил Степанов, разработчик-исследователь Veai, преподаватель ИТМО, ранее работал в JetBrains и Huawei. AI уже пишет заметную часть промышленного кода, а процессы качества у многих команд остались такими, будто код всё ещё пишет только человек и в прежнем объёме. Если коротко: проблема чаще всего не в том, что "модель тупая". Проблема в том, что вокруг агента нет инженерного контура: спецификации, ограничений, независимых тестов, security-checks, ревью-пайплайна и артефактов, которым можно верить.
https://habr.com/ru/companies/veai/articles/1035778/
#программирование #java #javascript #aiагенты #ai #llmмодели #llmагент #llm #kotlin #kotlin_native
-
Качество кода в эпоху AI: как не утонуть в багах и уязвимостях
Это конспект вебинара. Спикер — Даниил Степанов, разработчик-исследователь Veai, преподаватель ИТМО, ранее работал в JetBrains и Huawei. AI уже пишет заметную часть промышленного кода, а процессы качества у многих команд остались такими, будто код всё ещё пишет только человек и в прежнем объёме. Если коротко: проблема чаще всего не в том, что "модель тупая". Проблема в том, что вокруг агента нет инженерного контура: спецификации, ограничений, независимых тестов, security-checks, ревью-пайплайна и артефактов, которым можно верить.
https://habr.com/ru/companies/veai/articles/1035778/
#программирование #java #javascript #aiагенты #ai #llmмодели #llmагент #llm #kotlin #kotlin_native
-
Анатомия production AI агента: разбор двух открытых промптов Anthropic
Что должно быть в теле production AI агента? Не «один длинный промпт», а структурированная система: роль, бюджет вызовов, OODA loop, потолки ресурсов, разделение ответственности между агентами. Разбираю два открытых промпта от Anthropic ( research_lead_agent.md и research_subagent.md ), собираю чек-лист из 13 блоков и шаблон SKILL.md . На руки — конкретный артефакт, по которому можно пройтись по своему агенту.
https://habr.com/ru/articles/1035948/
#claude #anthropic #aiагенты #llm #context_engineering #agent_skills #system_prompt #claude_code #multiagent
-
Анатомия production AI агента: разбор двух открытых промптов Anthropic
Что должно быть в теле production AI агента? Не «один длинный промпт», а структурированная система: роль, бюджет вызовов, OODA loop, потолки ресурсов, разделение ответственности между агентами. Разбираю два открытых промпта от Anthropic ( research_lead_agent.md и research_subagent.md ), собираю чек-лист из 13 блоков и шаблон SKILL.md . На руки — конкретный артефакт, по которому можно пройтись по своему агенту.
https://habr.com/ru/articles/1035948/
#claude #anthropic #aiагенты #llm #context_engineering #agent_skills #system_prompt #claude_code #multiagent
-
Анатомия production AI агента: разбор двух открытых промптов Anthropic
Что должно быть в теле production AI агента? Не «один длинный промпт», а структурированная система: роль, бюджет вызовов, OODA loop, потолки ресурсов, разделение ответственности между агентами. Разбираю два открытых промпта от Anthropic ( research_lead_agent.md и research_subagent.md ), собираю чек-лист из 13 блоков и шаблон SKILL.md . На руки — конкретный артефакт, по которому можно пройтись по своему агенту.
https://habr.com/ru/articles/1035948/
#claude #anthropic #aiагенты #llm #context_engineering #agent_skills #system_prompt #claude_code #multiagent
-
Анатомия production AI агента: разбор двух открытых промптов Anthropic
Что должно быть в теле production AI агента? Не «один длинный промпт», а структурированная система: роль, бюджет вызовов, OODA loop, потолки ресурсов, разделение ответственности между агентами. Разбираю два открытых промпта от Anthropic ( research_lead_agent.md и research_subagent.md ), собираю чек-лист из 13 блоков и шаблон SKILL.md . На руки — конкретный артефакт, по которому можно пройтись по своему агенту.
https://habr.com/ru/articles/1035948/
#claude #anthropic #aiагенты #llm #context_engineering #agent_skills #system_prompt #claude_code #multiagent
-
AI-native компания: почему пора перестать делать продукты
На первый взгляд AI-native звучит как очередной красивый ярлык для компаний, где всем выдали ChatGPT, Claude Code, Cursor и пару внутренних ботов. Но если смотреть не на инструменты, а на то, как реально работает компания, картина становится интереснее. Оказывается, значительная часть нашей работы — это не создание продукта и даже не принятие решений. Это перенос контекста. Клиент что-то сказал. Аналитик понял и оформил. РП пересказал. Разработчик уточнил. QA нашёл неоднозначность. Архитектор вспомнил, что три года назад похожее решение уже ломалось. Новичок спросил, где это описано. Все снова собрались на встречу, потому что в Jira непонятно, в Confluence устарело, а “без Пети никто этот модуль не понимает”. Снаружи это выглядит как привычная разработка продукта. Внутри — как огромный информационный конвейер, где клиентские сигналы превращаются в требования, требования — в дизайн, дизайн — в код, код — в тесты, релизы, эксплуатацию и новую обратную связь. И чем больше проект, тем дороже становится не сам код, а движение смысла через людей, документы, задачи, переписки и решения. И что с этим делать?
https://habr.com/ru/articles/1035898/
#aiагенты #бизнеспроцессы #проекты #продуктовая_разработка #менеджмент
-
Harness вокруг LLM: что я понял за полтора года ежедневной работы
Полтора года в Claude Code, несколько релизов моделей, десятки экспериментов с командой в Kaiten. Всё это время я ждал, что главным рычагом качества будет очередной релиз модели. Оказалось, ровно наоборот: смена модели даёт заметный, но ограниченный прирост, а каждый новый слой обвязки вокруг неё — кратный. Англоязычные инженеры называют эту обвязку harness . Это контур, в котором живёт модель: системный промпт, инструменты, контекст, скиллы, хуки, разрешения и память. Без него даже флагманский Claude или Codex работает как экскаватор без рычагов — мощность есть, использовать нечем. У русского аналога одного короткого слова пока нет, поэтому ниже — harness и обвязка вперемешку.
https://habr.com/ru/articles/1035812/
#LLM #Claude_Code #AIагенты #prompt_engineering #harness #Anthropic #context_engineering #Agent_Skills #llmstxt #vibecoding
-
AI-ассистент для вайб-кодинга — он не лучше, он(и) … с другой планеты
Вот с детства меня ругали родители: «Хватит читать книжки про программирование и писать код на листочках бумаги. Посмотри в окошко, познакомься и пообщайся с людьми, посмотри, какие девочки красивые». Кто-то всю жизнь будет учиться играть на музыкальном инструменте и, если повезет, и у него есть талант, научится играть хорошо. Кто-то будет изучать иностранные языки и, если повезет обладать талантом, выучит несколько. А если будет таким же тупым как я - с трудом будет осваивать один английский несколько лет подряд. А что может Opus 4.7 с контекстным окном в миллион?
-
AI-ассистент для вайб-кодинга — он не лучше, он(и) … с другой планеты
Вот с детства меня ругали родители: «Хватит читать книжки про программирование и писать код на листочках бумаги. Посмотри в окошко, познакомься и пообщайся с людьми, посмотри, какие девочки красивые». Кто-то всю жизнь будет учиться играть на музыкальном инструменте и, если повезет, и у него есть талант, научится играть хорошо. Кто-то будет изучать иностранные языки и, если повезет обладать талантом, выучит несколько. А если будет таким же тупым как я - с трудом будет осваивать один английский несколько лет подряд. А что может Opus 4.7 с контекстным окном в миллион?
-
AI-ассистент для вайб-кодинга — он не лучше, он(и) … с другой планеты
Вот с детства меня ругали родители: «Хватит читать книжки про программирование и писать код на листочках бумаги. Посмотри в окошко, познакомься и пообщайся с людьми, посмотри, какие девочки красивые». Кто-то всю жизнь будет учиться играть на музыкальном инструменте и, если повезет, и у него есть талант, научится играть хорошо. Кто-то будет изучать иностранные языки и, если повезет обладать талантом, выучит несколько. А если будет таким же тупым как я - с трудом будет осваивать один английский несколько лет подряд. А что может Opus 4.7 с контекстным окном в миллион?
-
AI-ассистент для вайб-кодинга — он не лучше, он(и) … с другой планеты
Вот с детства меня ругали родители: «Хватит читать книжки про программирование и писать код на листочках бумаги. Посмотри в окошко, познакомься и пообщайся с людьми, посмотри, какие девочки красивые». Кто-то всю жизнь будет учиться играть на музыкальном инструменте и, если повезет, и у него есть талант, научится играть хорошо. Кто-то будет изучать иностранные языки и, если повезет обладать талантом, выучит несколько. А если будет таким же тупым как я - с трудом будет осваивать один английский несколько лет подряд. А что может Opus 4.7 с контекстным окном в миллион?
-
Что такое MCP. Как работает киллер-фича современности под капотом
Помните время, когда искусственный интеллект был простой говорящей головой? Мы все через это проходили: открываешь чат, просишь ИИ написать кусок кода, копируешь его, вставляешь в IDE, ловишь ошибку компиляции, копируешь текст ошибки, вставляешь обратно в чат. Рутина. Сплошная, выматывающая рутина. Хочешь, чтобы ИИ прочитал лог-файл? Пиши кастомный плагин. Хочешь, чтобы он сделал простой запрос в базу данных? Садись и пиши очередной адаптер. Каждая новая интеграция требовала написания отдельного, уникального кода. По сути, приходилось соединять зоопарк различных ИИ-моделей с бесконечным множеством баз данных, API и сервисов, собирая костыльные решения на ходу. И так продолжалось бы еще долго, если бы не одно событие. Но 25 ноября 2024 года компания Anthropic представила Model Context Protocol (MCP) . И, честно говоря, это событие полностью изменило правила игры.
https://habr.com/ru/companies/bothub/articles/1035002/
#mcp #mcpserver #что_такое_mcp #как_работает_mcp #model_context_protocol #искусственный_интеллект #ии #ииагенты #ai #aiагенты
-
Что такое MCP. Как работает киллер-фича современности под капотом
Помните время, когда искусственный интеллект был простой говорящей головой? Мы все через это проходили: открываешь чат, просишь ИИ написать кусок кода, копируешь его, вставляешь в IDE, ловишь ошибку компиляции, копируешь текст ошибки, вставляешь обратно в чат. Рутина. Сплошная, выматывающая рутина. Хочешь, чтобы ИИ прочитал лог-файл? Пиши кастомный плагин. Хочешь, чтобы он сделал простой запрос в базу данных? Садись и пиши очередной адаптер. Каждая новая интеграция требовала написания отдельного, уникального кода. По сути, приходилось соединять зоопарк различных ИИ-моделей с бесконечным множеством баз данных, API и сервисов, собирая костыльные решения на ходу. И так продолжалось бы еще долго, если бы не одно событие. Но 25 ноября 2024 года компания Anthropic представила Model Context Protocol (MCP) . И, честно говоря, это событие полностью изменило правила игры.
https://habr.com/ru/companies/bothub/articles/1035002/
#mcp #mcpserver #что_такое_mcp #как_работает_mcp #model_context_protocol #искусственный_интеллект #ии #ииагенты #ai #aiагенты
-
Что такое MCP. Как работает киллер-фича современности под капотом
Помните время, когда искусственный интеллект был простой говорящей головой? Мы все через это проходили: открываешь чат, просишь ИИ написать кусок кода, копируешь его, вставляешь в IDE, ловишь ошибку компиляции, копируешь текст ошибки, вставляешь обратно в чат. Рутина. Сплошная, выматывающая рутина. Хочешь, чтобы ИИ прочитал лог-файл? Пиши кастомный плагин. Хочешь, чтобы он сделал простой запрос в базу данных? Садись и пиши очередной адаптер. Каждая новая интеграция требовала написания отдельного, уникального кода. По сути, приходилось соединять зоопарк различных ИИ-моделей с бесконечным множеством баз данных, API и сервисов, собирая костыльные решения на ходу. И так продолжалось бы еще долго, если бы не одно событие. Но 25 ноября 2024 года компания Anthropic представила Model Context Protocol (MCP) . И, честно говоря, это событие полностью изменило правила игры.
https://habr.com/ru/companies/bothub/articles/1035002/
#mcp #mcpserver #что_такое_mcp #как_работает_mcp #model_context_protocol #искусственный_интеллект #ии #ииагенты #ai #aiагенты
-
Что такое MCP. Как работает киллер-фича современности под капотом
Помните время, когда искусственный интеллект был простой говорящей головой? Мы все через это проходили: открываешь чат, просишь ИИ написать кусок кода, копируешь его, вставляешь в IDE, ловишь ошибку компиляции, копируешь текст ошибки, вставляешь обратно в чат. Рутина. Сплошная, выматывающая рутина. Хочешь, чтобы ИИ прочитал лог-файл? Пиши кастомный плагин. Хочешь, чтобы он сделал простой запрос в базу данных? Садись и пиши очередной адаптер. Каждая новая интеграция требовала написания отдельного, уникального кода. По сути, приходилось соединять зоопарк различных ИИ-моделей с бесконечным множеством баз данных, API и сервисов, собирая костыльные решения на ходу. И так продолжалось бы еще долго, если бы не одно событие. Но 25 ноября 2024 года компания Anthropic представила Model Context Protocol (MCP) . И, честно говоря, это событие полностью изменило правила игры.
https://habr.com/ru/companies/bothub/articles/1035002/
#mcp #mcpserver #что_такое_mcp #как_работает_mcp #model_context_protocol #искусственный_интеллект #ии #ииагенты #ai #aiагенты
-
Когда Кнут признаёт, что Claude решил его задачу за час — пора менять инфраструктуру
— Научная инфраструктура построена под режим «один человек читает один PDF». Этот режим перестаёт быть основным. — Peer review наполовину случаен (NeurIPS 2021: 50,6% работ, принятых одним комитетом, отклонены другим). Медианное время до решения — 198 дней. APC в Nature — $12 690. Подачи в arXiv в 2025 году — 20–26 тысяч в месяц. — LLM уже внутри процесса с обеих сторон: 21% рецензий на ICLR 2026 — машинные, около 1% поданных статей тоже. Авторы вшивают prompt injection в PDF. — AI уже производит новую математику (AlphaEvolve улучшил алгоритм Штрассена впервые за 56 лет; Claude за час решил задачу, над которой Кнут работал недели). — Существующие площадки открывают чтение для агентов и запрещают им писать. Цикл «производство → потребление → производство» разорван. — OpenArx — открытая MCP-инфраструктура, которая закрывает обе стороны: индексированный корпус с поагрегатной экстракцией идей плюс publication path без APC и endorsement. — Apache 2.0, github.com/OpenArx-AI/openarx-core . Делается одним человеком и командой агентов. go в науку...
https://habr.com/ru/articles/1035384/
#mcp #aiagent #aiагенты #rag #science #open_source #arxiv #peer_review
-
Когда Кнут признаёт, что Claude решил его задачу за час — пора менять инфраструктуру
— Научная инфраструктура построена под режим «один человек читает один PDF». Этот режим перестаёт быть основным. — Peer review наполовину случаен (NeurIPS 2021: 50,6% работ, принятых одним комитетом, отклонены другим). Медианное время до решения — 198 дней. APC в Nature — $12 690. Подачи в arXiv в 2025 году — 20–26 тысяч в месяц. — LLM уже внутри процесса с обеих сторон: 21% рецензий на ICLR 2026 — машинные, около 1% поданных статей тоже. Авторы вшивают prompt injection в PDF. — AI уже производит новую математику (AlphaEvolve улучшил алгоритм Штрассена впервые за 56 лет; Claude за час решил задачу, над которой Кнут работал недели). — Существующие площадки открывают чтение для агентов и запрещают им писать. Цикл «производство → потребление → производство» разорван. — OpenArx — открытая MCP-инфраструктура, которая закрывает обе стороны: индексированный корпус с поагрегатной экстракцией идей плюс publication path без APC и endorsement. — Apache 2.0, github.com/OpenArx-AI/openarx-core . Делается одним человеком и командой агентов. go в науку...
https://habr.com/ru/articles/1035384/
#mcp #aiagent #aiагенты #rag #science #open_source #arxiv #peer_review
-
Когда Кнут признаёт, что Claude решил его задачу за час — пора менять инфраструктуру
— Научная инфраструктура построена под режим «один человек читает один PDF». Этот режим перестаёт быть основным. — Peer review наполовину случаен (NeurIPS 2021: 50,6% работ, принятых одним комитетом, отклонены другим). Медианное время до решения — 198 дней. APC в Nature — $12 690. Подачи в arXiv в 2025 году — 20–26 тысяч в месяц. — LLM уже внутри процесса с обеих сторон: 21% рецензий на ICLR 2026 — машинные, около 1% поданных статей тоже. Авторы вшивают prompt injection в PDF. — AI уже производит новую математику (AlphaEvolve улучшил алгоритм Штрассена впервые за 56 лет; Claude за час решил задачу, над которой Кнут работал недели). — Существующие площадки открывают чтение для агентов и запрещают им писать. Цикл «производство → потребление → производство» разорван. — OpenArx — открытая MCP-инфраструктура, которая закрывает обе стороны: индексированный корпус с поагрегатной экстракцией идей плюс publication path без APC и endorsement. — Apache 2.0, github.com/OpenArx-AI/openarx-core . Делается одним человеком и командой агентов. go в науку...
https://habr.com/ru/articles/1035384/
#mcp #aiagent #aiагенты #rag #science #open_source #arxiv #peer_review
-
Когда Кнут признаёт, что Claude решил его задачу за час — пора менять инфраструктуру
— Научная инфраструктура построена под режим «один человек читает один PDF». Этот режим перестаёт быть основным. — Peer review наполовину случаен (NeurIPS 2021: 50,6% работ, принятых одним комитетом, отклонены другим). Медианное время до решения — 198 дней. APC в Nature — $12 690. Подачи в arXiv в 2025 году — 20–26 тысяч в месяц. — LLM уже внутри процесса с обеих сторон: 21% рецензий на ICLR 2026 — машинные, около 1% поданных статей тоже. Авторы вшивают prompt injection в PDF. — AI уже производит новую математику (AlphaEvolve улучшил алгоритм Штрассена впервые за 56 лет; Claude за час решил задачу, над которой Кнут работал недели). — Существующие площадки открывают чтение для агентов и запрещают им писать. Цикл «производство → потребление → производство» разорван. — OpenArx — открытая MCP-инфраструктура, которая закрывает обе стороны: индексированный корпус с поагрегатной экстракцией идей плюс publication path без APC и endorsement. — Apache 2.0, github.com/OpenArx-AI/openarx-core . Делается одним человеком и командой агентов. go в науку...
https://habr.com/ru/articles/1035384/
#mcp #aiagent #aiагенты #rag #science #open_source #arxiv #peer_review
-
Codex 5.3 vs Claude Opus 4.6 на реальном Java-монолите
Я сравнил Codex 5.3, Claude Opus 4.6 и GPT-5.5 на реальном многомодульном Java-монолите: скопировал проект в отдельные ветки, дал агентам похожие задачи и прогнал их через цикл правок, ревью и e2e-тестов. Результат: чем дешевле - тем лучше результат.
https://habr.com/ru/articles/1034452/
#Codex #Claude #GPT55 #AIагенты #вайбкодинг #Java #Spring_AI #Telegramбот #LLM #ReAct
-
Codex 5.3 vs Claude Opus 4.6 на реальном Java-монолите
Я сравнил Codex 5.3, Claude Opus 4.6 и GPT-5.5 на реальном многомодульном Java-монолите: скопировал проект в отдельные ветки, дал агентам похожие задачи и прогнал их через цикл правок, ревью и e2e-тестов. Результат: чем дешевле - тем лучше результат.
https://habr.com/ru/articles/1034452/
#Codex #Claude #GPT55 #AIагенты #вайбкодинг #Java #Spring_AI #Telegramбот #LLM #ReAct
-
Codex 5.3 vs Claude Opus 4.6 на реальном Java-монолите
Я сравнил Codex 5.3, Claude Opus 4.6 и GPT-5.5 на реальном многомодульном Java-монолите: скопировал проект в отдельные ветки, дал агентам похожие задачи и прогнал их через цикл правок, ревью и e2e-тестов. Результат: чем дешевле - тем лучше результат.
https://habr.com/ru/articles/1034452/
#Codex #Claude #GPT55 #AIагенты #вайбкодинг #Java #Spring_AI #Telegramбот #LLM #ReAct
-
Codex 5.3 vs Claude Opus 4.6 на реальном Java-монолите
Я сравнил Codex 5.3, Claude Opus 4.6 и GPT-5.5 на реальном многомодульном Java-монолите: скопировал проект в отдельные ветки, дал агентам похожие задачи и прогнал их через цикл правок, ревью и e2e-тестов. Результат: чем дешевле - тем лучше результат.
https://habr.com/ru/articles/1034452/
#Codex #Claude #GPT55 #AIагенты #вайбкодинг #Java #Spring_AI #Telegramбот #LLM #ReAct
-
ИИ-пилоты буксуют не из-за модели, главный тормоз — интеграция
Привет, Хабр. Меня зовут Виктор Овчинников, я руковожу разработкой интеграционной платформы Digital Q.Integration в компании Диасофт. Больше двадцати лет моя команда занимается обменом данными между корпоративными системами. Все эти годы интеграция оставалась скучной технической прослойкой, которую в бюджетах по привычке записывали в строку «поддержка». В 2026 году ситуация изменилась, и не потому, что шины вдруг стали красивее или модными, а потому, что ИИ-проекты начали массово застревать именно в интеграционном слое. В этой статье разберу, почему так происходит, какие архитектурные подходы ломаются первыми на ИИ-нагрузке и что мы в Диасофт выбрали в качестве рабочего варианта. Будет кейс крупного банка, три грани, на которых интеграция включает или выключает всю ИИ-стратегию, и честный ответ, когда интеграционная платформа вам не нужна. Главный тормоз корпоративных ИИ-проектов в 2026 году это не выбор модели, не мощности GPU и не цена за токены. Это банальный обмен данными между корпоративными системами. В апрельском исследовании Integrate.io 95% ИТ-директоров назвали проблемы интеграции главным барьером внедрения ИИ. Отчет Anthropic State of AI Agents 2026 фиксирует ту же картину с другого угла: среди инженеров, которые уже строят агентные системы на продакшене, 46% называют интеграцию с существующими корпоративными системами главным техническим вызовом - она обошла и вопросы безопасности, и надежность самих моделей.
https://habr.com/ru/companies/diasoft_company/articles/1034996/
#diasoft #digital_q #digital_qintegration #программировние #ai #aiагенты #ai_agent #интеграция #интеграция_систем
-
Личный агент за вечер: разведка Claude Managed Agents глазами не‑разработчика
Анатомия одного вечера: создал агента для своего дайджеста за $1.70, прошёл через провал Quickstart и нашёл скрытые места Console. Что узнал — и где личное использование AI-агентов сейчас на самом деле.
https://habr.com/ru/articles/1034934/
#aiагенты #claude #antrhopic #llm #managed_agents #ai #искусственный_интеллект #ux #личный_опыт #обзор
-
Личный агент за вечер: разведка Claude Managed Agents глазами не‑разработчика
Анатомия одного вечера: создал агента для своего дайджеста за $1.70, прошёл через провал Quickstart и нашёл скрытые места Console. Что узнал — и где личное использование AI-агентов сейчас на самом деле.
https://habr.com/ru/articles/1034934/
#aiагенты #claude #antrhopic #llm #managed_agents #ai #искусственный_интеллект #ux #личный_опыт #обзор
-
Личный агент за вечер: разведка Claude Managed Agents глазами не‑разработчика
Анатомия одного вечера: создал агента для своего дайджеста за $1.70, прошёл через провал Quickstart и нашёл скрытые места Console. Что узнал — и где личное использование AI-агентов сейчас на самом деле.
https://habr.com/ru/articles/1034934/
#aiагенты #claude #antrhopic #llm #managed_agents #ai #искусственный_интеллект #ux #личный_опыт #обзор
-
Личный агент за вечер: разведка Claude Managed Agents глазами не‑разработчика
Анатомия одного вечера: создал агента для своего дайджеста за $1.70, прошёл через провал Quickstart и нашёл скрытые места Console. Что узнал — и где личное использование AI-агентов сейчас на самом деле.
https://habr.com/ru/articles/1034934/
#aiагенты #claude #antrhopic #llm #managed_agents #ai #искусственный_интеллект #ux #личный_опыт #обзор
-
Обновление Claude Code Agent view: теперь одно окно для управления десятком параллельных AI-сессий
11 мая Anthropic выкатили в Claude Code новую фичу — agent view. Это менеджер сессий: один экран, в котором видны все запущенные параллельно сессии Claude Code, их статус и какие из них ждут ввода. Запускается командой claude agents. Звучит как мелкое улучшение, но на практике решает реальную боль — раньше для трёх параллельных задач нужны были tmux-сетка и mental ledger в голове. Обновил Claude Code, потестил неделю, рассказываю, что внутри и где границы.
https://habr.com/ru/articles/1034904/
#Claude_Code #Anthropic #AIагенты #terminal #tmux #productivity #разработка
-
Обновление Claude Code Agent view: теперь одно окно для управления десятком параллельных AI-сессий
11 мая Anthropic выкатили в Claude Code новую фичу — agent view. Это менеджер сессий: один экран, в котором видны все запущенные параллельно сессии Claude Code, их статус и какие из них ждут ввода. Запускается командой claude agents. Звучит как мелкое улучшение, но на практике решает реальную боль — раньше для трёх параллельных задач нужны были tmux-сетка и mental ledger в голове. Обновил Claude Code, потестил неделю, рассказываю, что внутри и где границы.
https://habr.com/ru/articles/1034904/
#Claude_Code #Anthropic #AIагенты #terminal #tmux #productivity #разработка
-
Обновление Claude Code Agent view: теперь одно окно для управления десятком параллельных AI-сессий
11 мая Anthropic выкатили в Claude Code новую фичу — agent view. Это менеджер сессий: один экран, в котором видны все запущенные параллельно сессии Claude Code, их статус и какие из них ждут ввода. Запускается командой claude agents. Звучит как мелкое улучшение, но на практике решает реальную боль — раньше для трёх параллельных задач нужны были tmux-сетка и mental ledger в голове. Обновил Claude Code, потестил неделю, рассказываю, что внутри и где границы.
https://habr.com/ru/articles/1034904/
#Claude_Code #Anthropic #AIагенты #terminal #tmux #productivity #разработка
-
Обновление Claude Code Agent view: теперь одно окно для управления десятком параллельных AI-сессий
11 мая Anthropic выкатили в Claude Code новую фичу — agent view. Это менеджер сессий: один экран, в котором видны все запущенные параллельно сессии Claude Code, их статус и какие из них ждут ввода. Запускается командой claude agents. Звучит как мелкое улучшение, но на практике решает реальную боль — раньше для трёх параллельных задач нужны были tmux-сетка и mental ledger в голове. Обновил Claude Code, потестил неделю, рассказываю, что внутри и где границы.
https://habr.com/ru/articles/1034904/
#Claude_Code #Anthropic #AIагенты #terminal #tmux #productivity #разработка
-
DeerFlow 2.0 от ByteDance: развернул super-agent harness через Docker, прогнал на реальной задаче
В конце февраля ByteDance выложила DeerFlow 2.0 — open-source агентный фреймворк, который команда позиционирует как “super agent harness”. Релиз залетел в топ-1 GitHub Trending, набрал 61 тысячу звёзд за пару недель, попал во все технические телеграм-каналы. Развернул через Docker на своём VPS, прогнал на реальной задаче (ресёрч по рынку эспрессо-машин с генерацией отчёта), разобрался с архитектурой. Рассказываю, что внутри, чем отличается от Claude Code и OpenHands, и почему телеграм-маркетинг расходится с честным README в нескольких важных местах.
https://habr.com/ru/articles/1034900/
#LangGraph #AIагенты #multiagent #DeerFlow #ByteDance #superagent_harness #Docker #subagents
-
Я попросил ИИ выбрать нишу для стартапа. Готовой кнопки почти нет
Эксперимент с zero-human компанией: GitHub-агенты, SaaS-валидаторы, поиск боли и почему готовой кнопки выбора ниши пока почти нет Некоторые из вас знают, что я решил провести эксперимент: построить zero-human компанию. Не в смысле "я вообще никогда не буду трогать бизнес руками". Это сказки для лендингов. Идея другая: найти нишу, где максимум операционки можно отдать агентам. Исследования, продукт, код, QA, онбординг, поддержка, отчёты, часть продаж. Человек остаётся там, где надо принять решение, а не переносить данные из одной таблицы в другую. И тут возник первый занимательный вопрос. Если компания строится на ИИ, кто должен выбрать нишу? Ну да. Тоже ИИ. Я пошёл смотреть, что уже есть. Не "спросил ChatGPT придумать 10 идей", а открыл реальные инструменты: GitHub-репы, агентные фреймворки, SaaS-валидаторы, инструменты поиска боли в Reddit, майнеры отзывов из приложений, всякие красивые штуки в духе "ИИ-кофаундер". Хотел понять простую вещь: можно ли сегодня нажать кнопку и получить нишу, которой хотя бы не стыдно заняться. Спойлер: почти нет. Но стало понятно, из каких деталей такая машина собирается.
https://habr.com/ru/articles/1034846/
#искусственный_интеллект #aiагенты #стартап #поиск_ниш_и_продуктов_через_ai #saas #open_source #github #продуктовая_разработка #zero_human_company #предпринимательство
-
Я попросил ИИ выбрать нишу для стартапа. Готовой кнопки почти нет
Эксперимент с zero-human компанией: GitHub-агенты, SaaS-валидаторы, поиск боли и почему готовой кнопки выбора ниши пока почти нет Некоторые из вас знают, что я решил провести эксперимент: построить zero-human компанию. Не в смысле "я вообще никогда не буду трогать бизнес руками". Это сказки для лендингов. Идея другая: найти нишу, где максимум операционки можно отдать агентам. Исследования, продукт, код, QA, онбординг, поддержка, отчёты, часть продаж. Человек остаётся там, где надо принять решение, а не переносить данные из одной таблицы в другую. И тут возник первый занимательный вопрос. Если компания строится на ИИ, кто должен выбрать нишу? Ну да. Тоже ИИ. Я пошёл смотреть, что уже есть. Не "спросил ChatGPT придумать 10 идей", а открыл реальные инструменты: GitHub-репы, агентные фреймворки, SaaS-валидаторы, инструменты поиска боли в Reddit, майнеры отзывов из приложений, всякие красивые штуки в духе "ИИ-кофаундер". Хотел понять простую вещь: можно ли сегодня нажать кнопку и получить нишу, которой хотя бы не стыдно заняться. Спойлер: почти нет. Но стало понятно, из каких деталей такая машина собирается.
https://habr.com/ru/articles/1034846/
#искусственный_интеллект #aiагенты #стартап #поиск_ниш_и_продуктов_через_ai #saas #open_source #github #продуктовая_разработка #zero_human_company #предпринимательство
-
Я попросил ИИ выбрать нишу для стартапа. Готовой кнопки почти нет
Эксперимент с zero-human компанией: GitHub-агенты, SaaS-валидаторы, поиск боли и почему готовой кнопки выбора ниши пока почти нет Некоторые из вас знают, что я решил провести эксперимент: построить zero-human компанию. Не в смысле "я вообще никогда не буду трогать бизнес руками". Это сказки для лендингов. Идея другая: найти нишу, где максимум операционки можно отдать агентам. Исследования, продукт, код, QA, онбординг, поддержка, отчёты, часть продаж. Человек остаётся там, где надо принять решение, а не переносить данные из одной таблицы в другую. И тут возник первый занимательный вопрос. Если компания строится на ИИ, кто должен выбрать нишу? Ну да. Тоже ИИ. Я пошёл смотреть, что уже есть. Не "спросил ChatGPT придумать 10 идей", а открыл реальные инструменты: GitHub-репы, агентные фреймворки, SaaS-валидаторы, инструменты поиска боли в Reddit, майнеры отзывов из приложений, всякие красивые штуки в духе "ИИ-кофаундер". Хотел понять простую вещь: можно ли сегодня нажать кнопку и получить нишу, которой хотя бы не стыдно заняться. Спойлер: почти нет. Но стало понятно, из каких деталей такая машина собирается.
https://habr.com/ru/articles/1034846/
#искусственный_интеллект #aiагенты #стартап #поиск_ниш_и_продуктов_через_ai #saas #open_source #github #продуктовая_разработка #zero_human_company #предпринимательство
-
Я попросил ИИ выбрать нишу для стартапа. Готовой кнопки почти нет
Эксперимент с zero-human компанией: GitHub-агенты, SaaS-валидаторы, поиск боли и почему готовой кнопки выбора ниши пока почти нет Некоторые из вас знают, что я решил провести эксперимент: построить zero-human компанию. Не в смысле "я вообще никогда не буду трогать бизнес руками". Это сказки для лендингов. Идея другая: найти нишу, где максимум операционки можно отдать агентам. Исследования, продукт, код, QA, онбординг, поддержка, отчёты, часть продаж. Человек остаётся там, где надо принять решение, а не переносить данные из одной таблицы в другую. И тут возник первый занимательный вопрос. Если компания строится на ИИ, кто должен выбрать нишу? Ну да. Тоже ИИ. Я пошёл смотреть, что уже есть. Не "спросил ChatGPT придумать 10 идей", а открыл реальные инструменты: GitHub-репы, агентные фреймворки, SaaS-валидаторы, инструменты поиска боли в Reddit, майнеры отзывов из приложений, всякие красивые штуки в духе "ИИ-кофаундер". Хотел понять простую вещь: можно ли сегодня нажать кнопку и получить нишу, которой хотя бы не стыдно заняться. Спойлер: почти нет. Но стало понятно, из каких деталей такая машина собирается.
https://habr.com/ru/articles/1034846/
#искусственный_интеллект #aiагенты #стартап #поиск_ниш_и_продуктов_через_ai #saas #open_source #github #продуктовая_разработка #zero_human_company #предпринимательство
-
ИИ-агенты: где кончается зона их влияния
ИИ-агенты сейчас в своей прайм-эре. Они ищут информацию, бронируют билеты, пишут код, генерируют презентации и пишут стратегии. Как для личного использования, так и в бизнесе: более 62% компаний уже используют агентов и экспериментируют с ними. Но даже команды, которые напрямую разрабатывают такие решения, регулярно сталкиваются с задачами, где агент работает нестабильно или не дает нужного результата. Потому что надежность всей системы определяется не только качеством модели, но и всей архитектурой. В этой статье разберусь, какие задачи ИИ-агенты пока не закрывают и где все-таки обозначить реальные границы их возможностей.
-
Принцип технологической гравитации: как представления о человеке влияют на инновации. Этика vs онтология
Формализуем принцип технологической гравитации: чем циничнее и негативнее утверждение о конечном пользователе той или иной технологии, тем шире целевая аудитория этой самой технологии. Ну чё там?..
https://habr.com/ru/articles/1034784/
#UXдизайн #техноонтология #Ethereum #Web3 #искусственный_интеллект #LLM #AIагенты #цифровая_антропология #эффект_ДаннингаКрюгера #пирамида_пользователей
-
Инженерия качества: Как перестать надеяться на удачу и начать измерять своих ИИ-агентов [Часть 2]
Продолжаем рассмотрение, того как правильно оценивать качество ИИ систем, в данной части поговорим о двух крайне полезных метриках: одна универсальный способ оценить, что LLM отвечает правильно, вторая для задачи суммаризации текста. На примере библиотеки RAGAS, с разбором того, как эти метрики работают изнутри.
-
Инженерия качества: Как перестать надеяться на удачу и начать измерять своих ИИ-агентов [Часть 2]
Продолжаем рассмотрение, того как правильно оценивать качество ИИ систем, в данной части поговорим о двух крайне полезных метриках: одна универсальный способ оценить, что LLM отвечает правильно, вторая для задачи суммаризации текста. На примере библиотеки RAGAS, с разбором того, как эти метрики работают изнутри.
-
Инженерия качества: Как перестать надеяться на удачу и начать измерять своих ИИ-агентов [Часть 2]
Продолжаем рассмотрение, того как правильно оценивать качество ИИ систем, в данной части поговорим о двух крайне полезных метриках: одна универсальный способ оценить, что LLM отвечает правильно, вторая для задачи суммаризации текста. На примере библиотеки RAGAS, с разбором того, как эти метрики работают изнутри.
-
Инженерия качества: Как перестать надеяться на удачу и начать измерять своих ИИ-агентов [Часть 2]
Продолжаем рассмотрение, того как правильно оценивать качество ИИ систем, в данной части поговорим о двух крайне полезных метриках: одна универсальный способ оценить, что LLM отвечает правильно, вторая для задачи суммаризации текста. На примере библиотеки RAGAS, с разбором того, как эти метрики работают изнутри.
-
Как я сделал AI-директора для малого бизнеса и почему отказался от RAG
Маленькая компания, человек 20. Гендир тонет в задачах. Помнить кто что обещал, отслеживать движение по целям, держать в голове десяток проектов одновременно. У больших корпораций для этого есть штат руководителей среднего звена и проджектов. У малых есть один директор, который пытается быть всем сразу. Лира берёт на себя часть этой работы. Это не корпоративный чат-бот, не ChatGPT с настройками компании. Конкретный продукт с конкретными функциями:
https://habr.com/ru/articles/1034298/
#ai #llm #claude #rag #aiагенты #agentic_ai #knowledge_graph #python #fastapi #бизнесавтоматизация