#context_engineering — Public Fediverse posts on home.social

industrial curiosity @industrialcuriosity · 2026-05-28 · 20:00 UTC

TokenSpiracy: How AI Providers Are Picking Our Pockets https://medium.com/p/tokenspiracy-how-ai-providers-are-picking-our-pockets-d38b2893c39f?source=social.tw

#ai #context_engineering #softwareengineering #observability #agentic_ai #finops

industrial curiosity @[email protected] · 2026-05-28 · 20:00 UTC

TokenSpiracy: How AI Providers Are Picking Our Pockets https://medium.com/p/tokenspiracy-how-ai-providers-are-picking-our-pockets-d38b2893c39f?source=social.tw

#ai #context_engineering #softwareengineering #observability #agentic_ai #finops

Habr @[email protected] · 2026-05-26 · 15:32 UTC

Память на миллион, а толку ноль: как мы спасали ИИ-агента от «тупости»

На связи Сергей Смирнов, AI-инженер и основатель LLMStart.ru. Сегодня разбираем горячую тему, на которой спотыкаются многие разработчики ботов — память нейросетей. У всех современных топовых моделей появились гигантские окна контекста — от миллиона токенов. Кажется, что теперь туда можно просто закинуть всю историю переписки, все корпоративные методички, и агент сам во всём разберётся или не разберётся?.. В статье разбираем реальный кейс — как мы управляем памятью ИИ-агента, чтобы он отвечал быстро, точно и не сжигал бюджет на токены впустую. Внутри — наглядные графики, три механизма очистки памяти и хитрый инженерный трюк с изолированным субагентом-аудитором.

https://habr.com/ru/companies/llmstart/articles/1038506/

#LangChain #ИИагенты #RAG #context_engineering #LLM #AIdriven_разработка #llmstart #контекстинжиниринг #production #productionready

#productionready #production #контекстинжиниринг #llmstart #aidriven_разработка #llm

Habr @[email protected] · 2026-05-26 · 15:32 UTC

Память на миллион, а толку ноль: как мы спасали ИИ-агента от «тупости»

На связи Сергей Смирнов, AI-инженер и основатель LLMStart.ru. Сегодня разбираем горячую тему, на которой спотыкаются многие разработчики ботов — память нейросетей. У всех современных топовых моделей появились гигантские окна контекста — от миллиона токенов. Кажется, что теперь туда можно просто закинуть всю историю переписки, все корпоративные методички, и агент сам во всём разберётся или не разберётся?.. В статье разбираем реальный кейс — как мы управляем памятью ИИ-агента, чтобы он отвечал быстро, точно и не сжигал бюджет на токены впустую. Внутри — наглядные графики, три механизма очистки памяти и хитрый инженерный трюк с изолированным субагентом-аудитором.

https://habr.com/ru/companies/llmstart/articles/1038506/

#LangChain #ИИагенты #RAG #context_engineering #LLM #AIdriven_разработка #llmstart #контекстинжиниринг #production #productionready

#productionready #production #контекстинжиниринг #llmstart #aidriven_разработка #llm

Habr @[email protected] · 2026-05-26 · 15:32 UTC

Память на миллион, а толку ноль: как мы спасали ИИ-агента от «тупости»

На связи Сергей Смирнов, AI-инженер и основатель LLMStart.ru. Сегодня разбираем горячую тему, на которой спотыкаются многие разработчики ботов — память нейросетей. У всех современных топовых моделей появились гигантские окна контекста — от миллиона токенов. Кажется, что теперь туда можно просто закинуть всю историю переписки, все корпоративные методички, и агент сам во всём разберётся или не разберётся?.. В статье разбираем реальный кейс — как мы управляем памятью ИИ-агента, чтобы он отвечал быстро, точно и не сжигал бюджет на токены впустую. Внутри — наглядные графики, три механизма очистки памяти и хитрый инженерный трюк с изолированным субагентом-аудитором.

https://habr.com/ru/companies/llmstart/articles/1038506/

#LangChain #ИИагенты #RAG #context_engineering #LLM #AIdriven_разработка #llmstart #контекстинжиниринг #production #productionready

#productionready #production #контекстинжиниринг #llmstart #aidriven_разработка #llm

Habr @[email protected] · 2026-05-26 · 15:32 UTC

Память на миллион, а толку ноль: как мы спасали ИИ-агента от «тупости»

На связи Сергей Смирнов, AI-инженер и основатель LLMStart.ru. Сегодня разбираем горячую тему, на которой спотыкаются многие разработчики ботов — память нейросетей. У всех современных топовых моделей появились гигантские окна контекста — от миллиона токенов. Кажется, что теперь туда можно просто закинуть всю историю переписки, все корпоративные методички, и агент сам во всём разберётся или не разберётся?.. В статье разбираем реальный кейс — как мы управляем памятью ИИ-агента, чтобы он отвечал быстро, точно и не сжигал бюджет на токены впустую. Внутри — наглядные графики, три механизма очистки памяти и хитрый инженерный трюк с изолированным субагентом-аудитором.

https://habr.com/ru/companies/llmstart/articles/1038506/

#LangChain #ИИагенты #RAG #context_engineering #LLM #AIdriven_разработка #llmstart #контекстинжиниринг #production #productionready

#langchain #ииагенты #rag #context_engineering #llm #aidriven_разработка

Habr @[email protected] · 2026-05-26 · 07:22 UTC

Почему ломается ваш AI-агент — и почему смена модели обычно его не чинит

Представьте внутреннего AI-агента, который помогает компании искать общие документы и управлять ими. Он работает. До тех пор, пока 12–15% запросов не начинают падать. Агент возвращает не тот документ, редактирует не тот файл, молча падает или уверенно ссылается на файл, которого не существует. Поиск по фото отказывает с той же частотой. Ошибки размазаны равномерно по пользователям, фичам и запросам. Первое инстинктивное действие — поменять модель. Opus 4.5, GPT 5.5 или что там сейчас в топе лидерборда. Меняете. Счет за инференс растет в 4–5 раз, а общая доля ошибок снижается с 12% до 9%. Пользователи пишут о тех же проблемах. Бюджет следующего квартала сгорает за пару недель ради улучшения в 3 процентных пункта — и вы по-прежнему не понимаете, что именно было не так в системе и как улучшать ее дальше. Эта статья — о том, почему смена модели обычно разочаровывает и куда стоит смотреть в первую очередь. Большинство сбоев AI-систем живет в слое обвязки — orchestration, retrieval, tool definitions, retries, context management, — а не в самой модели. Дальше — метод, как отличить проблемы обвязки от проблем модели, кейс, в котором одно исправление в обвязке подняло completion rate с 26% до 88% без смены модели, и чек-лист, который помогает находить такие сбои в вашей собственной системе. Если вы никогда не делали подобной диагностики — ожидайте найти хотя бы один пункт, который стоит починить.

https://habr.com/ru/articles/1039292/

#aiагенты #llm #rag #orchestration #retrieval #tool_calling #context_engineering #evals #production #ai_infrastructure

#ai_infrastructure #production #evals #context_engineering #tool_calling #retrieval

Habr @[email protected] · 2026-05-26 · 07:22 UTC

Почему ломается ваш AI-агент — и почему смена модели обычно его не чинит

Представьте внутреннего AI-агента, который помогает компании искать общие документы и управлять ими. Он работает. До тех пор, пока 12–15% запросов не начинают падать. Агент возвращает не тот документ, редактирует не тот файл, молча падает или уверенно ссылается на файл, которого не существует. Поиск по фото отказывает с той же частотой. Ошибки размазаны равномерно по пользователям, фичам и запросам. Первое инстинктивное действие — поменять модель. Opus 4.5, GPT 5.5 или что там сейчас в топе лидерборда. Меняете. Счет за инференс растет в 4–5 раз, а общая доля ошибок снижается с 12% до 9%. Пользователи пишут о тех же проблемах. Бюджет следующего квартала сгорает за пару недель ради улучшения в 3 процентных пункта — и вы по-прежнему не понимаете, что именно было не так в системе и как улучшать ее дальше. Эта статья — о том, почему смена модели обычно разочаровывает и куда стоит смотреть в первую очередь. Большинство сбоев AI-систем живет в слое обвязки — orchestration, retrieval, tool definitions, retries, context management, — а не в самой модели. Дальше — метод, как отличить проблемы обвязки от проблем модели, кейс, в котором одно исправление в обвязке подняло completion rate с 26% до 88% без смены модели, и чек-лист, который помогает находить такие сбои в вашей собственной системе. Если вы никогда не делали подобной диагностики — ожидайте найти хотя бы один пункт, который стоит починить.

https://habr.com/ru/articles/1039292/

#aiагенты #llm #rag #orchestration #retrieval #tool_calling #context_engineering #evals #production #ai_infrastructure

#ai_infrastructure #production #evals #context_engineering #tool_calling #retrieval

Habr @[email protected] · 2026-05-26 · 07:22 UTC

Почему ломается ваш AI-агент — и почему смена модели обычно его не чинит

Представьте внутреннего AI-агента, который помогает компании искать общие документы и управлять ими. Он работает. До тех пор, пока 12–15% запросов не начинают падать. Агент возвращает не тот документ, редактирует не тот файл, молча падает или уверенно ссылается на файл, которого не существует. Поиск по фото отказывает с той же частотой. Ошибки размазаны равномерно по пользователям, фичам и запросам. Первое инстинктивное действие — поменять модель. Opus 4.5, GPT 5.5 или что там сейчас в топе лидерборда. Меняете. Счет за инференс растет в 4–5 раз, а общая доля ошибок снижается с 12% до 9%. Пользователи пишут о тех же проблемах. Бюджет следующего квартала сгорает за пару недель ради улучшения в 3 процентных пункта — и вы по-прежнему не понимаете, что именно было не так в системе и как улучшать ее дальше. Эта статья — о том, почему смена модели обычно разочаровывает и куда стоит смотреть в первую очередь. Большинство сбоев AI-систем живет в слое обвязки — orchestration, retrieval, tool definitions, retries, context management, — а не в самой модели. Дальше — метод, как отличить проблемы обвязки от проблем модели, кейс, в котором одно исправление в обвязке подняло completion rate с 26% до 88% без смены модели, и чек-лист, который помогает находить такие сбои в вашей собственной системе. Если вы никогда не делали подобной диагностики — ожидайте найти хотя бы один пункт, который стоит починить.

https://habr.com/ru/articles/1039292/

#aiагенты #llm #rag #orchestration #retrieval #tool_calling #context_engineering #evals #production #ai_infrastructure

#ai_infrastructure #production #evals #context_engineering #tool_calling #retrieval

Habr @[email protected] · 2026-05-26 · 07:22 UTC

Почему ломается ваш AI-агент — и почему смена модели обычно его не чинит

Представьте внутреннего AI-агента, который помогает компании искать общие документы и управлять ими. Он работает. До тех пор, пока 12–15% запросов не начинают падать. Агент возвращает не тот документ, редактирует не тот файл, молча падает или уверенно ссылается на файл, которого не существует. Поиск по фото отказывает с той же частотой. Ошибки размазаны равномерно по пользователям, фичам и запросам. Первое инстинктивное действие — поменять модель. Opus 4.5, GPT 5.5 или что там сейчас в топе лидерборда. Меняете. Счет за инференс растет в 4–5 раз, а общая доля ошибок снижается с 12% до 9%. Пользователи пишут о тех же проблемах. Бюджет следующего квартала сгорает за пару недель ради улучшения в 3 процентных пункта — и вы по-прежнему не понимаете, что именно было не так в системе и как улучшать ее дальше. Эта статья — о том, почему смена модели обычно разочаровывает и куда стоит смотреть в первую очередь. Большинство сбоев AI-систем живет в слое обвязки — orchestration, retrieval, tool definitions, retries, context management, — а не в самой модели. Дальше — метод, как отличить проблемы обвязки от проблем модели, кейс, в котором одно исправление в обвязке подняло completion rate с 26% до 88% без смены модели, и чек-лист, который помогает находить такие сбои в вашей собственной системе. Если вы никогда не делали подобной диагностики — ожидайте найти хотя бы один пункт, который стоит починить.

https://habr.com/ru/articles/1039292/

#aiагенты #llm #rag #orchestration #retrieval #tool_calling #context_engineering #evals #production #ai_infrastructure

#aiагенты #llm #rag #orchestration #retrieval #tool_calling

Habr @[email protected] · 2026-05-25 · 17:32 UTC

От RAG-прототипа к агенту в продакшн: путь по метрикам, а не по моде

На связи Сергей Смирнов, AI-инженер LLMStart.ru. Сегодня расскажу о полноценном кейсе, который мы делали для компании Айтон: агенте-консультанте по 1С:УНФ, который помогает отвечать на вопросы клиентов по базе знаний, реальным диалогам поддержки и контексту конкретного обращения. Разберу всю хронологию, нюансы и путь от первой гипотезы до продакшена, которым уже пользуются клиенты. Для бизнеса этот кейс интересен как пример реальной автоматизации через ИИ: сначала ассистент для сотрудников, потом сервис для клиентов. Для технарей — подходом, где решение эволюционировало от RAG-прототипа к агенту на основании данных и метрик, а не потому, что «так модно».

https://habr.com/ru/companies/llmstart/articles/1038436/

#RAG #LLM #ИИагенты #LangChain #LangFuse #Ragas #метрики_качества #context_engineering #мультимодальность #ии

#ии #мультимодальность #context_engineering #метрики_качества #ragas #langfuse

Habr @[email protected] · 2026-05-25 · 17:32 UTC

От RAG-прототипа к агенту в продакшн: путь по метрикам, а не по моде

На связи Сергей Смирнов, AI-инженер LLMStart.ru. Сегодня расскажу о полноценном кейсе, который мы делали для компании Айтон: агенте-консультанте по 1С:УНФ, который помогает отвечать на вопросы клиентов по базе знаний, реальным диалогам поддержки и контексту конкретного обращения. Разберу всю хронологию, нюансы и путь от первой гипотезы до продакшена, которым уже пользуются клиенты. Для бизнеса этот кейс интересен как пример реальной автоматизации через ИИ: сначала ассистент для сотрудников, потом сервис для клиентов. Для технарей — подходом, где решение эволюционировало от RAG-прототипа к агенту на основании данных и метрик, а не потому, что «так модно».

https://habr.com/ru/companies/llmstart/articles/1038436/

#RAG #LLM #ИИагенты #LangChain #LangFuse #Ragas #метрики_качества #context_engineering #мультимодальность #ии

#ии #мультимодальность #context_engineering #метрики_качества #ragas #langfuse

Habr @[email protected] · 2026-05-25 · 17:32 UTC

От RAG-прототипа к агенту в продакшн: путь по метрикам, а не по моде

На связи Сергей Смирнов, AI-инженер LLMStart.ru. Сегодня расскажу о полноценном кейсе, который мы делали для компании Айтон: агенте-консультанте по 1С:УНФ, который помогает отвечать на вопросы клиентов по базе знаний, реальным диалогам поддержки и контексту конкретного обращения. Разберу всю хронологию, нюансы и путь от первой гипотезы до продакшена, которым уже пользуются клиенты. Для бизнеса этот кейс интересен как пример реальной автоматизации через ИИ: сначала ассистент для сотрудников, потом сервис для клиентов. Для технарей — подходом, где решение эволюционировало от RAG-прототипа к агенту на основании данных и метрик, а не потому, что «так модно».

https://habr.com/ru/companies/llmstart/articles/1038436/

#RAG #LLM #ИИагенты #LangChain #LangFuse #Ragas #метрики_качества #context_engineering #мультимодальность #ии

#ии #мультимодальность #context_engineering #метрики_качества #ragas #langfuse

Habr @[email protected] · 2026-05-25 · 17:32 UTC

От RAG-прототипа к агенту в продакшн: путь по метрикам, а не по моде

На связи Сергей Смирнов, AI-инженер LLMStart.ru. Сегодня расскажу о полноценном кейсе, который мы делали для компании Айтон: агенте-консультанте по 1С:УНФ, который помогает отвечать на вопросы клиентов по базе знаний, реальным диалогам поддержки и контексту конкретного обращения. Разберу всю хронологию, нюансы и путь от первой гипотезы до продакшена, которым уже пользуются клиенты. Для бизнеса этот кейс интересен как пример реальной автоматизации через ИИ: сначала ассистент для сотрудников, потом сервис для клиентов. Для технарей — подходом, где решение эволюционировало от RAG-прототипа к агенту на основании данных и метрик, а не потому, что «так модно».

https://habr.com/ru/companies/llmstart/articles/1038436/

#RAG #LLM #ИИагенты #LangChain #LangFuse #Ragas #метрики_качества #context_engineering #мультимодальность #ии

#rag #llm #ииагенты #langchain #langfuse #ragas

Habr @[email protected] · 2026-05-16 · 15:42 UTC

Анатомия production AI агента: разбор двух открытых промптов Anthropic

Что должно быть в теле production AI агента? Не «один длинный промпт», а структурированная система: роль, бюджет вызовов, OODA loop, потолки ресурсов, разделение ответственности между агентами. Разбираю два открытых промпта от Anthropic ( research_lead_agent.md и research_subagent.md ), собираю чек-лист из 13 блоков и шаблон SKILL.md . На руки — конкретный артефакт, по которому можно пройтись по своему агенту.

https://habr.com/ru/articles/1035948/

#claude #anthropic #aiагенты #llm #context_engineering #agent_skills #system_prompt #claude_code #multiagent

#multiagent #claude_code #system_prompt #agent_skills #context_engineering #llm

Habr @[email protected] · 2026-05-16 · 15:42 UTC

Анатомия production AI агента: разбор двух открытых промптов Anthropic

Что должно быть в теле production AI агента? Не «один длинный промпт», а структурированная система: роль, бюджет вызовов, OODA loop, потолки ресурсов, разделение ответственности между агентами. Разбираю два открытых промпта от Anthropic ( research_lead_agent.md и research_subagent.md ), собираю чек-лист из 13 блоков и шаблон SKILL.md . На руки — конкретный артефакт, по которому можно пройтись по своему агенту.

https://habr.com/ru/articles/1035948/

#claude #anthropic #aiагенты #llm #context_engineering #agent_skills #system_prompt #claude_code #multiagent

#multiagent #claude_code #system_prompt #agent_skills #context_engineering #llm

Habr @[email protected] · 2026-05-16 · 15:42 UTC

Анатомия production AI агента: разбор двух открытых промптов Anthropic

Что должно быть в теле production AI агента? Не «один длинный промпт», а структурированная система: роль, бюджет вызовов, OODA loop, потолки ресурсов, разделение ответственности между агентами. Разбираю два открытых промпта от Anthropic ( research_lead_agent.md и research_subagent.md ), собираю чек-лист из 13 блоков и шаблон SKILL.md . На руки — конкретный артефакт, по которому можно пройтись по своему агенту.

https://habr.com/ru/articles/1035948/

#claude #anthropic #aiагенты #llm #context_engineering #agent_skills #system_prompt #claude_code #multiagent

#multiagent #claude_code #system_prompt #agent_skills #context_engineering #llm

Habr @[email protected] · 2026-05-16 · 15:42 UTC

Анатомия production AI агента: разбор двух открытых промптов Anthropic

Что должно быть в теле production AI агента? Не «один длинный промпт», а структурированная система: роль, бюджет вызовов, OODA loop, потолки ресурсов, разделение ответственности между агентами. Разбираю два открытых промпта от Anthropic ( research_lead_agent.md и research_subagent.md ), собираю чек-лист из 13 блоков и шаблон SKILL.md . На руки — конкретный артефакт, по которому можно пройтись по своему агенту.

https://habr.com/ru/articles/1035948/

#claude #anthropic #aiагенты #llm #context_engineering #agent_skills #system_prompt #claude_code #multiagent

#claude #anthropic #aiагенты #llm #context_engineering #agent_skills

Habr @[email protected] · 2026-05-16 · 05:32 UTC

Harness вокруг LLM: что я понял за полтора года ежедневной работы

Полтора года в Claude Code, несколько релизов моделей, десятки экспериментов с командой в Kaiten. Всё это время я ждал, что главным рычагом качества будет очередной релиз модели. Оказалось, ровно наоборот: смена модели даёт заметный, но ограниченный прирост, а каждый новый слой обвязки вокруг неё — кратный. Англоязычные инженеры называют эту обвязку harness . Это контур, в котором живёт модель: системный промпт, инструменты, контекст, скиллы, хуки, разрешения и память. Без него даже флагманский Claude или Codex работает как экскаватор без рычагов — мощность есть, использовать нечем. У русского аналога одного короткого слова пока нет, поэтому ниже — harness и обвязка вперемешку.

https://habr.com/ru/articles/1035812/

#LLM #Claude_Code #AIагенты #prompt_engineering #harness #Anthropic #context_engineering #Agent_Skills #llmstxt #vibecoding

#vibecoding #llmstxt #agent_skills #context_engineering #anthropic #harness

Habr @[email protected] · 2026-05-16 · 05:32 UTC

Harness вокруг LLM: что я понял за полтора года ежедневной работы

Полтора года в Claude Code, несколько релизов моделей, десятки экспериментов с командой в Kaiten. Всё это время я ждал, что главным рычагом качества будет очередной релиз модели. Оказалось, ровно наоборот: смена модели даёт заметный, но ограниченный прирост, а каждый новый слой обвязки вокруг неё — кратный. Англоязычные инженеры называют эту обвязку harness . Это контур, в котором живёт модель: системный промпт, инструменты, контекст, скиллы, хуки, разрешения и память. Без него даже флагманский Claude или Codex работает как экскаватор без рычагов — мощность есть, использовать нечем. У русского аналога одного короткого слова пока нет, поэтому ниже — harness и обвязка вперемешку.

https://habr.com/ru/articles/1035812/

#LLM #Claude_Code #AIагенты #prompt_engineering #harness #Anthropic #context_engineering #Agent_Skills #llmstxt #vibecoding

#vibecoding #llmstxt #agent_skills #context_engineering #anthropic #harness

Habr @[email protected] · 2026-05-16 · 05:32 UTC

Harness вокруг LLM: что я понял за полтора года ежедневной работы

Полтора года в Claude Code, несколько релизов моделей, десятки экспериментов с командой в Kaiten. Всё это время я ждал, что главным рычагом качества будет очередной релиз модели. Оказалось, ровно наоборот: смена модели даёт заметный, но ограниченный прирост, а каждый новый слой обвязки вокруг неё — кратный. Англоязычные инженеры называют эту обвязку harness . Это контур, в котором живёт модель: системный промпт, инструменты, контекст, скиллы, хуки, разрешения и память. Без него даже флагманский Claude или Codex работает как экскаватор без рычагов — мощность есть, использовать нечем. У русского аналога одного короткого слова пока нет, поэтому ниже — harness и обвязка вперемешку.

https://habr.com/ru/articles/1035812/

#LLM #Claude_Code #AIагенты #prompt_engineering #harness #Anthropic #context_engineering #Agent_Skills #llmstxt #vibecoding

#vibecoding #llmstxt #agent_skills #context_engineering #anthropic #harness

Habr @[email protected] · 2026-05-16 · 05:32 UTC

Harness вокруг LLM: что я понял за полтора года ежедневной работы

Полтора года в Claude Code, несколько релизов моделей, десятки экспериментов с командой в Kaiten. Всё это время я ждал, что главным рычагом качества будет очередной релиз модели. Оказалось, ровно наоборот: смена модели даёт заметный, но ограниченный прирост, а каждый новый слой обвязки вокруг неё — кратный. Англоязычные инженеры называют эту обвязку harness . Это контур, в котором живёт модель: системный промпт, инструменты, контекст, скиллы, хуки, разрешения и память. Без него даже флагманский Claude или Codex работает как экскаватор без рычагов — мощность есть, использовать нечем. У русского аналога одного короткого слова пока нет, поэтому ниже — harness и обвязка вперемешку.

https://habr.com/ru/articles/1035812/

#LLM #Claude_Code #AIагенты #prompt_engineering #harness #Anthropic #context_engineering #Agent_Skills #llmstxt #vibecoding

#llm #claude_code #aiагенты #prompt_engineering #harness #anthropic

Habr @[email protected] · 2026-04-14 · 10:32 UTC

[Перевод] Ваш харнес, ваша память

Agent harness'ы стали основным способом построения агентов, и это надолго. Они неразрывно связаны с памятью агента. Если вы используете закрытый харнес — особенно за проприетарным API — вы добровольно передаёте контроль над памятью своего агента третьей стороне. Память критически важна для создания хороших и удобных агентных систем, а значит, это создаёт колоссальную привязку к платформе. Память — а вместе с ней и харнесы — должны быть открытыми, чтобы вы владели своими данными.

https://habr.com/ru/articles/1023156/

#agent_harness #агентная_память #LLM_агенты #vendor_lockin #open_source_агенты #context_engineering #stateful_агенты #Claude_Code #LangChain #modelagnostic

#modelagnostic #langchain #claude_code #stateful_агенты #context_engineering #open_source_агенты

Habr @[email protected] · 2026-04-14 · 10:32 UTC

[Перевод] Ваш харнес, ваша память

Agent harness'ы стали основным способом построения агентов, и это надолго. Они неразрывно связаны с памятью агента. Если вы используете закрытый харнес — особенно за проприетарным API — вы добровольно передаёте контроль над памятью своего агента третьей стороне. Память критически важна для создания хороших и удобных агентных систем, а значит, это создаёт колоссальную привязку к платформе. Память — а вместе с ней и харнесы — должны быть открытыми, чтобы вы владели своими данными.

https://habr.com/ru/articles/1023156/

#agent_harness #агентная_память #LLM_агенты #vendor_lockin #open_source_агенты #context_engineering #stateful_агенты #Claude_Code #LangChain #modelagnostic

#modelagnostic #langchain #claude_code #stateful_агенты #context_engineering #open_source_агенты

Habr @[email protected] · 2026-04-14 · 10:32 UTC

[Перевод] Ваш харнес, ваша память

Agent harness'ы стали основным способом построения агентов, и это надолго. Они неразрывно связаны с памятью агента. Если вы используете закрытый харнес — особенно за проприетарным API — вы добровольно передаёте контроль над памятью своего агента третьей стороне. Память критически важна для создания хороших и удобных агентных систем, а значит, это создаёт колоссальную привязку к платформе. Память — а вместе с ней и харнесы — должны быть открытыми, чтобы вы владели своими данными.

https://habr.com/ru/articles/1023156/

#agent_harness #агентная_память #LLM_агенты #vendor_lockin #open_source_агенты #context_engineering #stateful_агенты #Claude_Code #LangChain #modelagnostic

#modelagnostic #langchain #claude_code #stateful_агенты #context_engineering #open_source_агенты

Habr @[email protected] · 2026-04-14 · 10:32 UTC

[Перевод] Ваш харнес, ваша память

Agent harness'ы стали основным способом построения агентов, и это надолго. Они неразрывно связаны с памятью агента. Если вы используете закрытый харнес — особенно за проприетарным API — вы добровольно передаёте контроль над памятью своего агента третьей стороне. Память критически важна для создания хороших и удобных агентных систем, а значит, это создаёт колоссальную привязку к платформе. Память — а вместе с ней и харнесы — должны быть открытыми, чтобы вы владели своими данными.

https://habr.com/ru/articles/1023156/

#agent_harness #агентная_память #LLM_агенты #vendor_lockin #open_source_агенты #context_engineering #stateful_агенты #Claude_Code #LangChain #modelagnostic

#agent_harness #агентная_память #llm_агенты #vendor_lockin #open_source_агенты #context_engineering

Habr @[email protected] · 2026-04-02 · 13:12 UTC

Как меняется delivery, когда в команде появляются агенты

AI уже ускоряет создание кода, ADR и документации, но одновременно повышает нагрузку на ревью, проверку и контроль стабильности. Поэтому следующий шаг для инженерных команд - не просто встроить AI в текущий SDLC, а пересобрать сам процесс поставки вокруг контекста, harness, quality gates и learning loop.

https://habr.com/ru/articles/1012654/

#AInative_SDLC #SDLC #LLM #coding_agents #agentic_delivery #software_delivery #harness_engineering #context_engineering #platform_engineering #управление_разработкой

#управление_разработкой #platform_engineering #context_engineering #harness_engineering #software_delivery #agentic_delivery

Habr @[email protected] · 2026-04-02 · 13:12 UTC

Как меняется delivery, когда в команде появляются агенты

AI уже ускоряет создание кода, ADR и документации, но одновременно повышает нагрузку на ревью, проверку и контроль стабильности. Поэтому следующий шаг для инженерных команд - не просто встроить AI в текущий SDLC, а пересобрать сам процесс поставки вокруг контекста, harness, quality gates и learning loop.

https://habr.com/ru/articles/1012654/

#AInative_SDLC #SDLC #LLM #coding_agents #agentic_delivery #software_delivery #harness_engineering #context_engineering #platform_engineering #управление_разработкой

#управление_разработкой #platform_engineering #context_engineering #harness_engineering #software_delivery #agentic_delivery

Habr @[email protected] · 2026-04-02 · 13:12 UTC

Как меняется delivery, когда в команде появляются агенты

AI уже ускоряет создание кода, ADR и документации, но одновременно повышает нагрузку на ревью, проверку и контроль стабильности. Поэтому следующий шаг для инженерных команд - не просто встроить AI в текущий SDLC, а пересобрать сам процесс поставки вокруг контекста, harness, quality gates и learning loop.

https://habr.com/ru/articles/1012654/

#AInative_SDLC #SDLC #LLM #coding_agents #agentic_delivery #software_delivery #harness_engineering #context_engineering #platform_engineering #управление_разработкой

#управление_разработкой #platform_engineering #context_engineering #harness_engineering #software_delivery #agentic_delivery

Habr @[email protected] · 2026-04-02 · 13:12 UTC

Как меняется delivery, когда в команде появляются агенты

AI уже ускоряет создание кода, ADR и документации, но одновременно повышает нагрузку на ревью, проверку и контроль стабильности. Поэтому следующий шаг для инженерных команд - не просто встроить AI в текущий SDLC, а пересобрать сам процесс поставки вокруг контекста, harness, quality gates и learning loop.

https://habr.com/ru/articles/1012654/

#AInative_SDLC #SDLC #LLM #coding_agents #agentic_delivery #software_delivery #harness_engineering #context_engineering #platform_engineering #управление_разработкой

#ainative_sdlc #sdlc #llm #coding_agents #agentic_delivery #software_delivery

Habr @[email protected] · 2026-03-18 · 08:22 UTC

[Перевод] Skills для Claude Code: огромный гайд от инженера Anthropic

Skills стали одной из самых популярных точек расширения в Claude Code. Они гибкие, их легко создавать и распространять. Но эта гибкость усложняет понимание. Что работает лучше всего? Какие skills стоит делать? Как написать хороший skill? Когда имеет смысл делиться ими с другими? Мы в Anthropic активно используем skills в Claude Code — сейчас у нас их сотни в работе. Ниже — уроки, которые мы извлекли из этого опыта.

https://habr.com/ru/articles/1011524/

#Claude_Code_skills #создание_skills #типы_skills #верификация_кода #скаффолдинг #маркетплейс_плагинов #context_engineering #ранбуки #композиция_skills

#композиция_skills #ранбуки #context_engineering #маркетплейс_плагинов #скаффолдинг #верификация_кода

Habr @[email protected] · 2026-03-18 · 08:22 UTC

[Перевод] Skills для Claude Code: огромный гайд от инженера Anthropic

Skills стали одной из самых популярных точек расширения в Claude Code. Они гибкие, их легко создавать и распространять. Но эта гибкость усложняет понимание. Что работает лучше всего? Какие skills стоит делать? Как написать хороший skill? Когда имеет смысл делиться ими с другими? Мы в Anthropic активно используем skills в Claude Code — сейчас у нас их сотни в работе. Ниже — уроки, которые мы извлекли из этого опыта.

https://habr.com/ru/articles/1011524/

#Claude_Code_skills #создание_skills #типы_skills #верификация_кода #скаффолдинг #маркетплейс_плагинов #context_engineering #ранбуки #композиция_skills

#композиция_skills #ранбуки #context_engineering #маркетплейс_плагинов #скаффолдинг #верификация_кода

Habr @[email protected] · 2026-03-18 · 08:22 UTC

[Перевод] Skills для Claude Code: огромный гайд от инженера Anthropic

Skills стали одной из самых популярных точек расширения в Claude Code. Они гибкие, их легко создавать и распространять. Но эта гибкость усложняет понимание. Что работает лучше всего? Какие skills стоит делать? Как написать хороший skill? Когда имеет смысл делиться ими с другими? Мы в Anthropic активно используем skills в Claude Code — сейчас у нас их сотни в работе. Ниже — уроки, которые мы извлекли из этого опыта.

https://habr.com/ru/articles/1011524/

#Claude_Code_skills #создание_skills #типы_skills #верификация_кода #скаффолдинг #маркетплейс_плагинов #context_engineering #ранбуки #композиция_skills

#композиция_skills #ранбуки #context_engineering #маркетплейс_плагинов #скаффолдинг #верификация_кода

Habr @[email protected] · 2026-03-18 · 08:22 UTC

[Перевод] Skills для Claude Code: огромный гайд от инженера Anthropic

Skills стали одной из самых популярных точек расширения в Claude Code. Они гибкие, их легко создавать и распространять. Но эта гибкость усложняет понимание. Что работает лучше всего? Какие skills стоит делать? Как написать хороший skill? Когда имеет смысл делиться ими с другими? Мы в Anthropic активно используем skills в Claude Code — сейчас у нас их сотни в работе. Ниже — уроки, которые мы извлекли из этого опыта.

https://habr.com/ru/articles/1011524/

#Claude_Code_skills #создание_skills #типы_skills #верификация_кода #скаффолдинг #маркетплейс_плагинов #context_engineering #ранбуки #композиция_skills

#claude_code_skills #создание_skills #типы_skills #верификация_кода #скаффолдинг #маркетплейс_плагинов

Habr @[email protected] · 2026-03-15 · 10:02 UTC

[Перевод] 8 уровней агентной инженерии

Способности AI в написании кода растут быстрее, чем наше умение этими способностями пользоваться. Поэтому рост баллов на SWE-bench не коррелирует с метриками продуктивности, которые волнуют инженерных руководителей. Когда команда Anthropic выкатывает продукт вроде Cowork за 10 дней, а другая команда не может довести до ума сломанный POC на тех же моделях, разница в одном: первые закрыли разрыв между возможностями моделей и практикой, вторые — нет. Этот разрыв не закрывается за одну ночь. Он закрывается по уровням. Их 8. Большинство читающих эту статью, скорее всего, уже прошли первые несколько, и стоит стремиться к следующему, потому что каждый новый уровень — это резкий скачок производительности, а каждое улучшение моделей усиливает этот эффект ещё больше.

https://habr.com/ru/articles/1010430/

#Агентная_инженерия #LLM #context_engineering #background_agents #MCP #feedback_loops #compounding_engineering #code_review #оркестрация #автономность

#агентная_инженерия #llm #context_engineering #background_agents #mcp #feedback_loops

Habr @[email protected] · 2026-03-15 · 10:02 UTC

[Перевод] 8 уровней агентной инженерии

Способности AI в написании кода растут быстрее, чем наше умение этими способностями пользоваться. Поэтому рост баллов на SWE-bench не коррелирует с метриками продуктивности, которые волнуют инженерных руководителей. Когда команда Anthropic выкатывает продукт вроде Cowork за 10 дней, а другая команда не может довести до ума сломанный POC на тех же моделях, разница в одном: первые закрыли разрыв между возможностями моделей и практикой, вторые — нет. Этот разрыв не закрывается за одну ночь. Он закрывается по уровням. Их 8. Большинство читающих эту статью, скорее всего, уже прошли первые несколько, и стоит стремиться к следующему, потому что каждый новый уровень — это резкий скачок производительности, а каждое улучшение моделей усиливает этот эффект ещё больше.

https://habr.com/ru/articles/1010430/

#Агентная_инженерия #LLM #context_engineering #background_agents #MCP #feedback_loops #compounding_engineering #code_review #оркестрация #автономность

#агентная_инженерия #llm #context_engineering #background_agents #mcp #feedback_loops

Habr @[email protected] · 2026-03-15 · 10:02 UTC

[Перевод] 8 уровней агентной инженерии

Способности AI в написании кода растут быстрее, чем наше умение этими способностями пользоваться. Поэтому рост баллов на SWE-bench не коррелирует с метриками продуктивности, которые волнуют инженерных руководителей. Когда команда Anthropic выкатывает продукт вроде Cowork за 10 дней, а другая команда не может довести до ума сломанный POC на тех же моделях, разница в одном: первые закрыли разрыв между возможностями моделей и практикой, вторые — нет. Этот разрыв не закрывается за одну ночь. Он закрывается по уровням. Их 8. Большинство читающих эту статью, скорее всего, уже прошли первые несколько, и стоит стремиться к следующему, потому что каждый новый уровень — это резкий скачок производительности, а каждое улучшение моделей усиливает этот эффект ещё больше.

https://habr.com/ru/articles/1010430/

#Агентная_инженерия #LLM #context_engineering #background_agents #MCP #feedback_loops #compounding_engineering #code_review #оркестрация #автономность

#агентная_инженерия #llm #context_engineering #background_agents #mcp #feedback_loops

Habr @[email protected] · 2026-03-15 · 10:02 UTC

[Перевод] 8 уровней агентной инженерии

Способности AI в написании кода растут быстрее, чем наше умение этими способностями пользоваться. Поэтому рост баллов на SWE-bench не коррелирует с метриками продуктивности, которые волнуют инженерных руководителей. Когда команда Anthropic выкатывает продукт вроде Cowork за 10 дней, а другая команда не может довести до ума сломанный POC на тех же моделях, разница в одном: первые закрыли разрыв между возможностями моделей и практикой, вторые — нет. Этот разрыв не закрывается за одну ночь. Он закрывается по уровням. Их 8. Большинство читающих эту статью, скорее всего, уже прошли первые несколько, и стоит стремиться к следующему, потому что каждый новый уровень — это резкий скачок производительности, а каждое улучшение моделей усиливает этот эффект ещё больше.

https://habr.com/ru/articles/1010430/

#Агентная_инженерия #LLM #context_engineering #background_agents #MCP #feedback_loops #compounding_engineering #code_review #оркестрация #автономность

#автономность #оркестрация #code_review #compounding_engineering #feedback_loops #mcp

Habr @[email protected] · 2026-03-14 · 09:52 UTC

Ваш CLAUDE.md делает агента тупее. Исследование на 138 репозиториях это доказало

Я написал CLAUDE.md на 200 строк. Исследование ETH Zurich на 138 репозиториях говорит: мой агент стал от этого тупее на 3%, а я плачу на 20% больше за токены. Разбираюсь, что пошло не так.

https://habr.com/ru/articles/1010160/

#CLAUDEmd #AGENTSmd #контекст #AIагенты #coding_agents #ETH_Zurich #context_engineering

#claudemd #agentsmd #контекст #aiагенты #coding_agents #eth_zurich

Habr @[email protected] · 2026-03-14 · 09:52 UTC

Ваш CLAUDE.md делает агента тупее. Исследование на 138 репозиториях это доказало

Я написал CLAUDE.md на 200 строк. Исследование ETH Zurich на 138 репозиториях говорит: мой агент стал от этого тупее на 3%, а я плачу на 20% больше за токены. Разбираюсь, что пошло не так.

https://habr.com/ru/articles/1010160/

#CLAUDEmd #AGENTSmd #контекст #AIагенты #coding_agents #ETH_Zurich #context_engineering

#claudemd #agentsmd #контекст #aiагенты #coding_agents #eth_zurich

Habr @[email protected] · 2026-03-14 · 09:52 UTC

Ваш CLAUDE.md делает агента тупее. Исследование на 138 репозиториях это доказало

Я написал CLAUDE.md на 200 строк. Исследование ETH Zurich на 138 репозиториях говорит: мой агент стал от этого тупее на 3%, а я плачу на 20% больше за токены. Разбираюсь, что пошло не так.

https://habr.com/ru/articles/1010160/

#CLAUDEmd #AGENTSmd #контекст #AIагенты #coding_agents #ETH_Zurich #context_engineering

#claudemd #agentsmd #контекст #aiагенты #coding_agents #eth_zurich

Habr @[email protected] · 2026-03-14 · 09:52 UTC

Ваш CLAUDE.md делает агента тупее. Исследование на 138 репозиториях это доказало

Я написал CLAUDE.md на 200 строк. Исследование ETH Zurich на 138 репозиториях говорит: мой агент стал от этого тупее на 3%, а я плачу на 20% больше за токены. Разбираюсь, что пошло не так.

https://habr.com/ru/articles/1010160/

#CLAUDEmd #AGENTSmd #контекст #AIагенты #coding_agents #ETH_Zurich #context_engineering

#context_engineering #eth_zurich #coding_agents #aiагенты #контекст #agentsmd

Habr @[email protected] · 2026-03-02 · 06:42 UTC

Проблема не в промпте: как Claude Code плывет на длинных задачах и как управлять контекстом

На коротких задачах coding-агент выглядит почти как живой разработчик: читает код, гоняет тесты, находит проблему, предлагает diff, но на длинной дистанции магия заканчивается. Стоит агенту или пользователю подмешать еще пару логов, несколько файлов "на всякий случай" или еще один MCP-сервер, и агент начинает забывать договоренности, повторять уже проверенные шаги и терять план. Обычно это объясняют так: "модель тупит" или "надо лучше промптить", но на практике проблема часто в другом: мы складируем состояние задачи в историю чата и надеемся, что модель удержит его сама. Не удержит. Контекст у LLM - это не бездонный мешок, а рабочая часть "памяти" модели, ее нужно проектировать: что хранить отдельно, что подмешивать just-in-time, что выбрасывать после шага и что обязательно возвращать после compaction. В этой статье я разберу context engineering на примере coding agents, а конкретно на Claude Code: почему long context до сих пор деградирует, почему проблема особенно больно бьет по агентам, чем полезны /compact и Plan Mode, и как собрать минимальный контекстный конвейер без магии и лишней философии.

https://habr.com/ru/articles/1004994/

#ai #claude_code #coding_agents #context_engineering

#context_engineering #coding_agents #claude_code #ai

Habr @[email protected] · 2026-03-02 · 06:42 UTC

Проблема не в промпте: как Claude Code плывет на длинных задачах и как управлять контекстом

На коротких задачах coding-агент выглядит почти как живой разработчик: читает код, гоняет тесты, находит проблему, предлагает diff, но на длинной дистанции магия заканчивается. Стоит агенту или пользователю подмешать еще пару логов, несколько файлов "на всякий случай" или еще один MCP-сервер, и агент начинает забывать договоренности, повторять уже проверенные шаги и терять план. Обычно это объясняют так: "модель тупит" или "надо лучше промптить", но на практике проблема часто в другом: мы складируем состояние задачи в историю чата и надеемся, что модель удержит его сама. Не удержит. Контекст у LLM - это не бездонный мешок, а рабочая часть "памяти" модели, ее нужно проектировать: что хранить отдельно, что подмешивать just-in-time, что выбрасывать после шага и что обязательно возвращать после compaction. В этой статье я разберу context engineering на примере coding agents, а конкретно на Claude Code: почему long context до сих пор деградирует, почему проблема особенно больно бьет по агентам, чем полезны /compact и Plan Mode, и как собрать минимальный контекстный конвейер без магии и лишней философии.

https://habr.com/ru/articles/1004994/

#ai #claude_code #coding_agents #context_engineering

#context_engineering #coding_agents #claude_code #ai

Habr @[email protected] · 2026-03-02 · 06:42 UTC

Проблема не в промпте: как Claude Code плывет на длинных задачах и как управлять контекстом

На коротких задачах coding-агент выглядит почти как живой разработчик: читает код, гоняет тесты, находит проблему, предлагает diff, но на длинной дистанции магия заканчивается. Стоит агенту или пользователю подмешать еще пару логов, несколько файлов "на всякий случай" или еще один MCP-сервер, и агент начинает забывать договоренности, повторять уже проверенные шаги и терять план. Обычно это объясняют так: "модель тупит" или "надо лучше промптить", но на практике проблема часто в другом: мы складируем состояние задачи в историю чата и надеемся, что модель удержит его сама. Не удержит. Контекст у LLM - это не бездонный мешок, а рабочая часть "памяти" модели, ее нужно проектировать: что хранить отдельно, что подмешивать just-in-time, что выбрасывать после шага и что обязательно возвращать после compaction. В этой статье я разберу context engineering на примере coding agents, а конкретно на Claude Code: почему long context до сих пор деградирует, почему проблема особенно больно бьет по агентам, чем полезны /compact и Plan Mode, и как собрать минимальный контекстный конвейер без магии и лишней философии.

https://habr.com/ru/articles/1004994/

#ai #claude_code #coding_agents #context_engineering

#context_engineering #coding_agents #claude_code #ai

Habr @[email protected] · 2026-03-02 · 06:42 UTC

Проблема не в промпте: как Claude Code плывет на длинных задачах и как управлять контекстом

На коротких задачах coding-агент выглядит почти как живой разработчик: читает код, гоняет тесты, находит проблему, предлагает diff, но на длинной дистанции магия заканчивается. Стоит агенту или пользователю подмешать еще пару логов, несколько файлов "на всякий случай" или еще один MCP-сервер, и агент начинает забывать договоренности, повторять уже проверенные шаги и терять план. Обычно это объясняют так: "модель тупит" или "надо лучше промптить", но на практике проблема часто в другом: мы складируем состояние задачи в историю чата и надеемся, что модель удержит его сама. Не удержит. Контекст у LLM - это не бездонный мешок, а рабочая часть "памяти" модели, ее нужно проектировать: что хранить отдельно, что подмешивать just-in-time, что выбрасывать после шага и что обязательно возвращать после compaction. В этой статье я разберу context engineering на примере coding agents, а конкретно на Claude Code: почему long context до сих пор деградирует, почему проблема особенно больно бьет по агентам, чем полезны /compact и Plan Mode, и как собрать минимальный контекстный конвейер без магии и лишней философии.

https://habr.com/ru/articles/1004994/

#ai #claude_code #coding_agents #context_engineering