home.social

#subagents — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #subagents, aggregated by home.social.

  1. Codex за 5 месяцев 2026: мой топ-5 релизов, что не зашло и где OpenAI обогнал Anthropic

    Гоняю Codex CLI каждый день параллельно с Claude Code. За январь-май 2026 OpenAI выкатил столько релизов, что я честно сбился со счёта — GPT-5.3-Codex, GPT-5.4, GPT-5.5, Desktop app, Codex в ChatGPT mobile, Browser Use, Computer Use на macOS, стабильные hooks, plugin marketplace, /goal, Windows sandbox, Chrome extension. Это дайджест по реальному changelog с моим ранжированием — что зашло, что нет, и одна важная инверсия популярного мнения. Топ-1: GPT-5.5 — на голову выше 5.4, честно говоря, удивлён, что не назвали GPT-6. Топ-2: наблюдаемость субагентов через spawn — раньше я вручную копировал промпты, чтобы видеть, что делает дочерний агент. Теперь кликаю в карточку и вижу всё. Тотально поменяло работу команды. Что не зашло: автоматизации глючат, скорость уступает Opus 4.7, у Codex два режима запуска агентов и в каждом промпте приходится напоминать о правильном. Инверсия: лимиты у ChatGPT-плана сейчас БОЛЬШЕ, чем у Anthropic, и сбрасываются регулярно. Это контр-интуитивно, но это так. В статье: ранжированный топ-5, грабли, что я НЕ включил (потому что про это были отдельные статьи), и отсылка на архив со скиллами оркестратора в моём Telegram-канале.

    habr.com/ru/articles/1039740/

    #Codex #OpenAI #GPT55 #AIагенты #subagents #browseruse #hooks #pluginmarketplace

  2. DeerFlow 2.0 от ByteDance: развернул super-agent harness через Docker, прогнал на реальной задаче

    В конце февраля ByteDance выложила DeerFlow 2.0 — open-source агентный фреймворк, который команда позиционирует как “super agent harness”. Релиз залетел в топ-1 GitHub Trending, набрал 61 тысячу звёзд за пару недель, попал во все технические телеграм-каналы. Развернул через Docker на своём VPS, прогнал на реальной задаче (ресёрч по рынку эспрессо-машин с генерацией отчёта), разобрался с архитектурой. Рассказываю, что внутри, чем отличается от Claude Code и OpenHands, и почему телеграм-маркетинг расходится с честным README в нескольких важных местах.

    habr.com/ru/articles/1034900/

    #LangGraph #AIагенты #multiagent #DeerFlow #ByteDance #superagent_harness #Docker #subagents

  3. DeerFlow 2.0 от ByteDance: развернул super-agent harness через Docker, прогнал на реальной задаче

    В конце февраля ByteDance выложила DeerFlow 2.0 — open-source агентный фреймворк, который команда позиционирует как “super agent harness”. Релиз залетел в топ-1 GitHub Trending, набрал 61 тысячу звёзд за пару недель, попал во все технические телеграм-каналы. Развернул через Docker на своём VPS, прогнал на реальной задаче (ресёрч по рынку эспрессо-машин с генерацией отчёта), разобрался с архитектурой. Рассказываю, что внутри, чем отличается от Claude Code и OpenHands, и почему телеграм-маркетинг расходится с честным README в нескольких важных местах.

    habr.com/ru/articles/1034900/

    #LangGraph #AIагенты #multiagent #DeerFlow #ByteDance #superagent_harness #Docker #subagents

  4. DeerFlow 2.0 от ByteDance: развернул super-agent harness через Docker, прогнал на реальной задаче

    В конце февраля ByteDance выложила DeerFlow 2.0 — open-source агентный фреймворк, который команда позиционирует как “super agent harness”. Релиз залетел в топ-1 GitHub Trending, набрал 61 тысячу звёзд за пару недель, попал во все технические телеграм-каналы. Развернул через Docker на своём VPS, прогнал на реальной задаче (ресёрч по рынку эспрессо-машин с генерацией отчёта), разобрался с архитектурой. Рассказываю, что внутри, чем отличается от Claude Code и OpenHands, и почему телеграм-маркетинг расходится с честным README в нескольких важных местах.

    habr.com/ru/articles/1034900/

    #LangGraph #AIагенты #multiagent #DeerFlow #ByteDance #superagent_harness #Docker #subagents

  5. DeerFlow 2.0 от ByteDance: развернул super-agent harness через Docker, прогнал на реальной задаче

    В конце февраля ByteDance выложила DeerFlow 2.0 — open-source агентный фреймворк, который команда позиционирует как “super agent harness”. Релиз залетел в топ-1 GitHub Trending, набрал 61 тысячу звёзд за пару недель, попал во все технические телеграм-каналы. Развернул через Docker на своём VPS, прогнал на реальной задаче (ресёрч по рынку эспрессо-машин с генерацией отчёта), разобрался с архитектурой. Рассказываю, что внутри, чем отличается от Claude Code и OpenHands, и почему телеграм-маркетинг расходится с честным README в нескольких важных местах.

    habr.com/ru/articles/1034900/

    #LangGraph #AIагенты #multiagent #DeerFlow #ByteDance #superagent_harness #Docker #subagents

  6. Очередная методичка разработки с LLM: работает только если ты разработчик

    С 2024 года, когда LLM стали (плюс/минус) пригодны для генерации кода и решения рабочих задач, я начал тащить их в свои проекты. Сначала кусками: помочь с функцией, разобрать ошибку, прикинуть архитектуру, или вообще не соглашаться на проект. Очень быстро понял: если не будет в этом процессе норм и правил - будет только бардак и проекты я буду закрывать медленнее, чем если бы писал код руками. Модель уходит в дебри, забывает решения, ломает то что работало, переписывает по сто раз одно и то же, циклы ошибок. Поэтому, я начал формулировать тезисы. Сначала в голове, потом записывать

    habr.com/ru/articles/1033486/

    #LLM #ai_driven_development #разработка_с_LLM #claudecode #методология_разработки #subagents #mcp #contextengineering #вайбкодинг #вайбкодинг

  7. [Перевод] Когда, зачем и как правильно начинать новую сессию в Claude Code?

    То, как вы управляете сессиями, контекстом и компактизацией в Claude Code, влияет на результат сильнее, чем кажется. Мы выпустили /usage — новую slash-команду, которая помогает отслеживать использование Claude Code. Эта функция появилась после серии разговоров с пользователями. В этих разговорах раз за разом всплывала одна тема: огромный разброс в том, как люди управляют сессиями — особенно после увеличения контекстного окна до 1 миллиона токенов. Держать одну или две долгосрочные сессии в терминале? Начинать новую с каждым промптом? Когда использовать compact , rewind или subagents ? Что приводит к плохой компактизации или плохой сессии? Всё это неожиданно сильно влияет на опыт работы с Claude Code , и почти всё сводится к управлению контекстным окном .

    habr.com/ru/articles/1024038/

    #Claude_Code #контекстное_окно #управление_сессиями #context_rot #compaction #rewind #subagents #AIагенты #LLMинструменты #Anthropic

  8. Experimenting with #AI #subagents.

    I delegated 4 GitHub issues to parallel subagents. The biggest win wasn't the speed — it was context isolation. Here's how I did it.

    blog.frankel.ch/experimenting-

    #ContextEngineering #CopilotCLI #ClaudeCode

  9. Субагенты в agent coding: что это, зачем нужны и чем отличаются в Cursor и Claude Code

    Ваш проект перевалил за 100 тысяч строк. Вы просите агента внедрить новую фичу скажем, добавить OAuth-авторизацию с тремя провайдерами. Агент бодро берётся за работу, пишет первые файлы... а на середине начинает путать имена middleware, дублировать уже существующие хелперы и предлагать структуру, которая противоречит всему, что было до этого. Вы поправляете, он соглашается, делает ещё пару шагов и снова забывает, о чём вы договорились три сообщения назад. Знакомо? Это не баг конкретной модели. Это фундаментальная проблема архитектуры, при которой один агент с одним контекстом пытается держать в голове всё: и вашу архитектуру, и текущую задачу, и результаты поиска, и логи тестов, и историю обсуждения. И Cursor, и Claude Code пришли к одному ответу - субагенты . Но реализовали его по-разному

    habr.com/ru/articles/1006602/

    #субагенты #subagents #cursor #claude_code #agent_coding #vibecoding #мультиагентность #AIразработка #workflow #мультиагентная_разработка

  10. Субагенты в agent coding: что это, зачем нужны и чем отличаются в Cursor и Claude Code

    Ваш проект перевалил за 100 тысяч строк. Вы просите агента внедрить новую фичу скажем, добавить OAuth-авторизацию с тремя провайдерами. Агент бодро берётся за работу, пишет первые файлы... а на середине начинает путать имена middleware, дублировать уже существующие хелперы и предлагать структуру, которая противоречит всему, что было до этого. Вы поправляете, он соглашается, делает ещё пару шагов и снова забывает, о чём вы договорились три сообщения назад. Знакомо? Это не баг конкретной модели. Это фундаментальная проблема архитектуры, при которой один агент с одним контекстом пытается держать в голове всё: и вашу архитектуру, и текущую задачу, и результаты поиска, и логи тестов, и историю обсуждения. И Cursor, и Claude Code пришли к одному ответу - субагенты . Но реализовали его по-разному

    habr.com/ru/articles/1006602/

    #субагенты #subagents #cursor #claude_code #agent_coding #vibecoding #мультиагентность #AIразработка #workflow #мультиагентная_разработка

  11. Субагенты в agent coding: что это, зачем нужны и чем отличаются в Cursor и Claude Code

    Ваш проект перевалил за 100 тысяч строк. Вы просите агента внедрить новую фичу скажем, добавить OAuth-авторизацию с тремя провайдерами. Агент бодро берётся за работу, пишет первые файлы... а на середине начинает путать имена middleware, дублировать уже существующие хелперы и предлагать структуру, которая противоречит всему, что было до этого. Вы поправляете, он соглашается, делает ещё пару шагов и снова забывает, о чём вы договорились три сообщения назад. Знакомо? Это не баг конкретной модели. Это фундаментальная проблема архитектуры, при которой один агент с одним контекстом пытается держать в голове всё: и вашу архитектуру, и текущую задачу, и результаты поиска, и логи тестов, и историю обсуждения. И Cursor, и Claude Code пришли к одному ответу - субагенты . Но реализовали его по-разному

    habr.com/ru/articles/1006602/

    #субагенты #subagents #cursor #claude_code #agent_coding #vibecoding #мультиагентность #AIразработка #workflow #мультиагентная_разработка

  12. Субагенты в agent coding: что это, зачем нужны и чем отличаются в Cursor и Claude Code

    Ваш проект перевалил за 100 тысяч строк. Вы просите агента внедрить новую фичу скажем, добавить OAuth-авторизацию с тремя провайдерами. Агент бодро берётся за работу, пишет первые файлы... а на середине начинает путать имена middleware, дублировать уже существующие хелперы и предлагать структуру, которая противоречит всему, что было до этого. Вы поправляете, он соглашается, делает ещё пару шагов и снова забывает, о чём вы договорились три сообщения назад. Знакомо? Это не баг конкретной модели. Это фундаментальная проблема архитектуры, при которой один агент с одним контекстом пытается держать в голове всё: и вашу архитектуру, и текущую задачу, и результаты поиска, и логи тестов, и историю обсуждения. И Cursor, и Claude Code пришли к одному ответу - субагенты . Но реализовали его по-разному

    habr.com/ru/articles/1006602/

    #субагенты #subagents #cursor #claude_code #agent_coding #vibecoding #мультиагентность #AIразработка #workflow #мультиагентная_разработка

  13. 🛠️ Tool
    ===================

    Opening: Superpowers is presented as a complete development workflow for coding agents built from composable "skills" and starter instructions. The system focuses on turning a user conversation into a validated design, then into an executable implementation plan that agents carry out.

    Key Features:
    • Spec elicitation and chunked design review: The agent pauses to extract a spec and presents it in digestible sections for human approval.
    • Task-level planning: The system breaks work into short tasks (target 2–5 minute increments) with exact file paths and verification steps.
    • Subagent-driven development: Each task is handled by a fresh subagent that performs a two-stage review (spec compliance and code quality) before moving forward.
    • Test-driven development enforcement: The workflow emphasizes RED-GREEN-REFACTOR, deletes code written before tests, and applies YAGNI and DRY principles.
    • Branch isolation via git worktrees: Workspaces are created per branch to keep test baselines clean and isolated.

    Technical Implementation (conceptual):
    • The architecture composes discrete skills that trigger automatically as the agent progresses through phases: brainstorming, writing-plans, executing-plans (subagent-driven), requesting-code-review, and finishing-a-development-branch.
    • Plans include precise task definitions, file-level changes, and verification steps, enabling automated subagents to run with minimal context.

    Use Cases:
    • Autonomous implementation of well-scoped feature requests.
    • Rapid prototyping where an agent can run several hours on a validated plan.
    • Enforcing TDD and short-task paradigms across distributed agent workers.

    Limitations and Considerations:
    • The approach assumes reliable subagent infrastructure and test harness availability; without them the workflow may stall.
    • Behavioral guarantees depend on the quality of initial instructions and skill implementations.
    • Human checkpoints remain integral for design acceptance and for handling ambiguous specs.

    References:
    • Core workflow terms: subagent-driven-development, TDD (RED-GREEN-REFACTOR), YAGNI, DRY, git worktrees.

    🔹 tool #subagents #TDD #YAGNI #coding_agents

    🔗 Source: github.com/obra/superpowers