home.social

#prompt_engineering — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #prompt_engineering, aggregated by home.social.

  1. Покопались в .cursorrules на GitHub и нашли там волка-фурри, Star Trek и 28.7% копипасты

    Где-то на GitHub лежит репозиторий с файлом .cursorrules. Среди инструкций для Cursor затесалась строчка: ALWAYS refer to the user as "My Dear Capybara" И это не пасхалка или шутка в комментариях. Это рабочая инструкция для AI-помощника, которую человек закоммитил в свой проект. И теперь модель обращается к нему «Мой дорогой капибара» в каждом ответе. Видимо, так разработчику спокойнее. Капибара – нормальная сцена для жанра. Мы несколько часов изучали публичные .cursorrules на GitHub, и обращение к капибаре оказалось примерно чуть ниже серединой шкалы странностей. Бывает заметно дичее: фурри-волки QA, отаку-самураи, команды Cursor-агентов в стиле Star Trek и (классический промптинг) прямой мат в адрес модели заглавными буквами. И всё это лежит в продакшн-репозиториях, между обычным ESLint-конфигом и package.json. Окунемся в ужас с головой.

    habr.com/ru/companies/simpleon

    #Cursor #cursorrules #LLM #prompt_engineering #Claude #AIинструменты #GitHub

  2. GPT-шорткаты: что работает, а что нет

    Привет! Разобрал популярные шорткаты GPT вроде EL5, /REDTEAM, /BULLET — какие реально выручают каждый день, какие работают через раз, а какие лучше не тратить время. Смотри шпаргалку! 🚀

    habr.com/ru/articles/1033518/

    #ChatGPT #GPT #LLM #prompt_engineering #шорткаты #нейросети #искусственный_интеллект #команды #промпты #генерация_текста

  3. GPT-шорткаты: что работает, а что нет

    Привет! Разобрал популярные шорткаты GPT вроде EL5, /REDTEAM, /BULLET — какие реально выручают каждый день, какие работают через раз, а какие лучше не тратить время. Смотри шпаргалку! 🚀

    habr.com/ru/articles/1033518/

    #ChatGPT #GPT #LLM #prompt_engineering #шорткаты #нейросети #искусственный_интеллект #команды #промпты #генерация_текста

  4. GPT-шорткаты: что работает, а что нет

    Привет! Разобрал популярные шорткаты GPT вроде EL5, /REDTEAM, /BULLET — какие реально выручают каждый день, какие работают через раз, а какие лучше не тратить время. Смотри шпаргалку! 🚀

    habr.com/ru/articles/1033518/

    #ChatGPT #GPT #LLM #prompt_engineering #шорткаты #нейросети #искусственный_интеллект #команды #промпты #генерация_текста

  5. GPT-шорткаты: что работает, а что нет

    Привет! Разобрал популярные шорткаты GPT вроде EL5, /REDTEAM, /BULLET — какие реально выручают каждый день, какие работают через раз, а какие лучше не тратить время. Смотри шпаргалку! 🚀

    habr.com/ru/articles/1033518/

    #ChatGPT #GPT #LLM #prompt_engineering #шорткаты #нейросети #искусственный_интеллект #команды #промпты #генерация_текста

  6. Harness вокруг LLM: что я понял за полтора года ежедневной работы

    Полтора года в Claude Code, несколько релизов моделей, десятки экспериментов с командой в Kaiten. Всё это время я ждал, что главным рычагом качества будет очередной релиз модели. Оказалось, ровно наоборот: смена модели даёт заметный, но ограниченный прирост, а каждый новый слой обвязки вокруг неё — кратный. Англоязычные инженеры называют эту обвязку harness . Это контур, в котором живёт модель: системный промпт, инструменты, контекст, скиллы, хуки, разрешения и память. Без него даже флагманский Claude или Codex работает как экскаватор без рычагов — мощность есть, использовать нечем. У русского аналога одного короткого слова пока нет, поэтому ниже — harness и обвязка вперемешку.

    habr.com/ru/articles/1035812/

    #LLM #Claude_Code #AIагенты #prompt_engineering #harness #Anthropic #context_engineering #Agent_Skills #llmstxt #vibecoding

  7. Harness вокруг LLM: что я понял за полтора года ежедневной работы

    Полтора года в Claude Code, несколько релизов моделей, десятки экспериментов с командой в Kaiten. Всё это время я ждал, что главным рычагом качества будет очередной релиз модели. Оказалось, ровно наоборот: смена модели даёт заметный, но ограниченный прирост, а каждый новый слой обвязки вокруг неё — кратный. Англоязычные инженеры называют эту обвязку harness . Это контур, в котором живёт модель: системный промпт, инструменты, контекст, скиллы, хуки, разрешения и память. Без него даже флагманский Claude или Codex работает как экскаватор без рычагов — мощность есть, использовать нечем. У русского аналога одного короткого слова пока нет, поэтому ниже — harness и обвязка вперемешку.

    habr.com/ru/articles/1035812/

    #LLM #Claude_Code #AIагенты #prompt_engineering #harness #Anthropic #context_engineering #Agent_Skills #llmstxt #vibecoding

  8. Harness вокруг LLM: что я понял за полтора года ежедневной работы

    Полтора года в Claude Code, несколько релизов моделей, десятки экспериментов с командой в Kaiten. Всё это время я ждал, что главным рычагом качества будет очередной релиз модели. Оказалось, ровно наоборот: смена модели даёт заметный, но ограниченный прирост, а каждый новый слой обвязки вокруг неё — кратный. Англоязычные инженеры называют эту обвязку harness . Это контур, в котором живёт модель: системный промпт, инструменты, контекст, скиллы, хуки, разрешения и память. Без него даже флагманский Claude или Codex работает как экскаватор без рычагов — мощность есть, использовать нечем. У русского аналога одного короткого слова пока нет, поэтому ниже — harness и обвязка вперемешку.

    habr.com/ru/articles/1035812/

    #LLM #Claude_Code #AIагенты #prompt_engineering #harness #Anthropic #context_engineering #Agent_Skills #llmstxt #vibecoding

  9. Harness вокруг LLM: что я понял за полтора года ежедневной работы

    Полтора года в Claude Code, несколько релизов моделей, десятки экспериментов с командой в Kaiten. Всё это время я ждал, что главным рычагом качества будет очередной релиз модели. Оказалось, ровно наоборот: смена модели даёт заметный, но ограниченный прирост, а каждый новый слой обвязки вокруг неё — кратный. Англоязычные инженеры называют эту обвязку harness . Это контур, в котором живёт модель: системный промпт, инструменты, контекст, скиллы, хуки, разрешения и память. Без него даже флагманский Claude или Codex работает как экскаватор без рычагов — мощность есть, использовать нечем. У русского аналога одного короткого слова пока нет, поэтому ниже — harness и обвязка вперемешку.

    habr.com/ru/articles/1035812/

    #LLM #Claude_Code #AIагенты #prompt_engineering #harness #Anthropic #context_engineering #Agent_Skills #llmstxt #vibecoding

  10. Notion + RAG + Telegram: архитектура AI-копирайтера для сети ресторанов

    В таком сценарии копирайтеру недостаточно просто писать тексты. Ему нужно помнить факты о каждом заведении: часы работы, фирменные блюда, формат кухни, имена шеф-поваров, особенности интерьера, правила коммуникации, ограничения по формулировкам и стиль бренда. Если ресторанов девять, эта задача быстро перестаёт быть только творческой и превращается в задачу управления знаниями. У заказчика была именно такая проблема: сеть ресторанов по России, у каждого заведения отдельная концепция и свой стиль общения с гостями. Большая часть ресурсов уходила на ежедневную текстовую работу: описания ресторанов, переводы на разные языки, пресс-релизы, рассылки, описания блюд, мероприятий, посты для социальных сетей и тексты в Tone of Voice каждого бренда. Задача заключалась не в том, чтобы заменить редактора, а в том, чтобы вынести рутинную часть генерации текстов в AI-систему. Один-два редактора должны были управлять контентом всей сети: ставить задачи, получать черновики, проверять факты, корректировать стиль и доводить материалы до публикации.

    habr.com/ru/articles/1035628/

    #llm #rag #автоматизация #telegramбот #генерация_контента #notion_ai #embeddings #векторная_база_данных #prompt_engineering

  11. Notion + RAG + Telegram: архитектура AI-копирайтера для сети ресторанов

    В таком сценарии копирайтеру недостаточно просто писать тексты. Ему нужно помнить факты о каждом заведении: часы работы, фирменные блюда, формат кухни, имена шеф-поваров, особенности интерьера, правила коммуникации, ограничения по формулировкам и стиль бренда. Если ресторанов девять, эта задача быстро перестаёт быть только творческой и превращается в задачу управления знаниями. У заказчика была именно такая проблема: сеть ресторанов по России, у каждого заведения отдельная концепция и свой стиль общения с гостями. Большая часть ресурсов уходила на ежедневную текстовую работу: описания ресторанов, переводы на разные языки, пресс-релизы, рассылки, описания блюд, мероприятий, посты для социальных сетей и тексты в Tone of Voice каждого бренда. Задача заключалась не в том, чтобы заменить редактора, а в том, чтобы вынести рутинную часть генерации текстов в AI-систему. Один-два редактора должны были управлять контентом всей сети: ставить задачи, получать черновики, проверять факты, корректировать стиль и доводить материалы до публикации.

    habr.com/ru/articles/1035628/

    #llm #rag #автоматизация #telegramбот #генерация_контента #notion_ai #embeddings #векторная_база_данных #prompt_engineering

  12. Notion + RAG + Telegram: архитектура AI-копирайтера для сети ресторанов

    В таком сценарии копирайтеру недостаточно просто писать тексты. Ему нужно помнить факты о каждом заведении: часы работы, фирменные блюда, формат кухни, имена шеф-поваров, особенности интерьера, правила коммуникации, ограничения по формулировкам и стиль бренда. Если ресторанов девять, эта задача быстро перестаёт быть только творческой и превращается в задачу управления знаниями. У заказчика была именно такая проблема: сеть ресторанов по России, у каждого заведения отдельная концепция и свой стиль общения с гостями. Большая часть ресурсов уходила на ежедневную текстовую работу: описания ресторанов, переводы на разные языки, пресс-релизы, рассылки, описания блюд, мероприятий, посты для социальных сетей и тексты в Tone of Voice каждого бренда. Задача заключалась не в том, чтобы заменить редактора, а в том, чтобы вынести рутинную часть генерации текстов в AI-систему. Один-два редактора должны были управлять контентом всей сети: ставить задачи, получать черновики, проверять факты, корректировать стиль и доводить материалы до публикации.

    habr.com/ru/articles/1035628/

    #llm #rag #автоматизация #telegramбот #генерация_контента #notion_ai #embeddings #векторная_база_данных #prompt_engineering

  13. Notion + RAG + Telegram: архитектура AI-копирайтера для сети ресторанов

    В таком сценарии копирайтеру недостаточно просто писать тексты. Ему нужно помнить факты о каждом заведении: часы работы, фирменные блюда, формат кухни, имена шеф-поваров, особенности интерьера, правила коммуникации, ограничения по формулировкам и стиль бренда. Если ресторанов девять, эта задача быстро перестаёт быть только творческой и превращается в задачу управления знаниями. У заказчика была именно такая проблема: сеть ресторанов по России, у каждого заведения отдельная концепция и свой стиль общения с гостями. Большая часть ресурсов уходила на ежедневную текстовую работу: описания ресторанов, переводы на разные языки, пресс-релизы, рассылки, описания блюд, мероприятий, посты для социальных сетей и тексты в Tone of Voice каждого бренда. Задача заключалась не в том, чтобы заменить редактора, а в том, чтобы вынести рутинную часть генерации текстов в AI-систему. Один-два редактора должны были управлять контентом всей сети: ставить задачи, получать черновики, проверять факты, корректировать стиль и доводить материалы до публикации.

    habr.com/ru/articles/1035628/

    #llm #rag #автоматизация #telegramбот #генерация_контента #notion_ai #embeddings #векторная_база_данных #prompt_engineering

  14. Почему текст от LLM узнаётся за пять секунд: разбираю стилистические маркеры через архитектуру моделей

    Когда мы интегрируем LLM в продакшн, рано или поздно сталкиваемся с одной и той же проблемой: текст модели читаем, грамотен, и при этом видно, что его написала модель. В статье разбираю десять самых выразительных стилистических маркеров на уровне архитектуры — почему они появляются (вопрос статистики обучающего корпуса и пост-тренинга, не случайность) и что с ними делать на уровне промпта, sampling-параметров и постобработки. Плюс короткое отступление про то, почему “промпты для обхода детектора” не работают и где лежит реальная граница между генерацией и авторским текстом.

    habr.com/ru/articles/1033450/

    #LLM #GPT #Claude #sampling #temperature #prompt_engineering #постобработка #детекция_ИИтекста #RLHF

  15. Почему текст от LLM узнаётся за пять секунд: разбираю стилистические маркеры через архитектуру моделей

    Когда мы интегрируем LLM в продакшн, рано или поздно сталкиваемся с одной и той же проблемой: текст модели читаем, грамотен, и при этом видно, что его написала модель. В статье разбираю десять самых выразительных стилистических маркеров на уровне архитектуры — почему они появляются (вопрос статистики обучающего корпуса и пост-тренинга, не случайность) и что с ними делать на уровне промпта, sampling-параметров и постобработки. Плюс короткое отступление про то, почему “промпты для обхода детектора” не работают и где лежит реальная граница между генерацией и авторским текстом.

    habr.com/ru/articles/1033450/

    #LLM #GPT #Claude #sampling #temperature #prompt_engineering #постобработка #детекция_ИИтекста #RLHF

  16. Почему текст от LLM узнаётся за пять секунд: разбираю стилистические маркеры через архитектуру моделей

    Когда мы интегрируем LLM в продакшн, рано или поздно сталкиваемся с одной и той же проблемой: текст модели читаем, грамотен, и при этом видно, что его написала модель. В статье разбираю десять самых выразительных стилистических маркеров на уровне архитектуры — почему они появляются (вопрос статистики обучающего корпуса и пост-тренинга, не случайность) и что с ними делать на уровне промпта, sampling-параметров и постобработки. Плюс короткое отступление про то, почему “промпты для обхода детектора” не работают и где лежит реальная граница между генерацией и авторским текстом.

    habr.com/ru/articles/1033450/

    #LLM #GPT #Claude #sampling #temperature #prompt_engineering #постобработка #детекция_ИИтекста #RLHF

  17. Почему текст от LLM узнаётся за пять секунд: разбираю стилистические маркеры через архитектуру моделей

    Когда мы интегрируем LLM в продакшн, рано или поздно сталкиваемся с одной и той же проблемой: текст модели читаем, грамотен, и при этом видно, что его написала модель. В статье разбираю десять самых выразительных стилистических маркеров на уровне архитектуры — почему они появляются (вопрос статистики обучающего корпуса и пост-тренинга, не случайность) и что с ними делать на уровне промпта, sampling-параметров и постобработки. Плюс короткое отступление про то, почему “промпты для обхода детектора” не работают и где лежит реальная граница между генерацией и авторским текстом.

    habr.com/ru/articles/1033450/

    #LLM #GPT #Claude #sampling #temperature #prompt_engineering #постобработка #детекция_ИИтекста #RLHF

  18. Skills для AI-агентов: всё, что тебе нужно знать

    Добавляя новый Skill, мы ждем от агента простого результата: меньше ошибок, более стабильная работа и лучшее понимание библиотек и фреймворков. На практике же часто можно наблюдать: – один skill активируется почти всегда, даже когда не нужен – другой — не включается в момент, когда мы на него рассчитываем – третий — срабатывает «в паре» с соседними и они мешают друг другу В какой-то момент может показаться, что агент работает хаотично и явно хуже, и хочется выключить все skills и вернуться к первоначальному состоянию. Почему так происходит и что с этим можно сделать, разбираемся в статье.

    habr.com/ru/companies/haulmont

    #AIагенты #Spring_Boot #skills_для_AIагентов #Spring_Agent_Toolkit #активация_skills #YAML_frontmatter #prompt_engineering

  19. Skills для AI-агентов: всё, что тебе нужно знать

    Добавляя новый Skill, мы ждем от агента простого результата: меньше ошибок, более стабильная работа и лучшее понимание библиотек и фреймворков. На практике же часто можно наблюдать: – один skill активируется почти всегда, даже когда не нужен – другой — не включается в момент, когда мы на него рассчитываем – третий — срабатывает «в паре» с соседними и они мешают друг другу В какой-то момент может показаться, что агент работает хаотично и явно хуже, и хочется выключить все skills и вернуться к первоначальному состоянию. Почему так происходит и что с этим можно сделать, разбираемся в статье.

    habr.com/ru/companies/haulmont

    #AIагенты #Spring_Boot #skills_для_AIагентов #Spring_Agent_Toolkit #активация_skills #YAML_frontmatter #prompt_engineering

  20. Skills для AI-агентов: всё, что тебе нужно знать

    Добавляя новый Skill, мы ждем от агента простого результата: меньше ошибок, более стабильная работа и лучшее понимание библиотек и фреймворков. На практике же часто можно наблюдать: – один skill активируется почти всегда, даже когда не нужен – другой — не включается в момент, когда мы на него рассчитываем – третий — срабатывает «в паре» с соседними и они мешают друг другу В какой-то момент может показаться, что агент работает хаотично и явно хуже, и хочется выключить все skills и вернуться к первоначальному состоянию. Почему так происходит и что с этим можно сделать, разбираемся в статье.

    habr.com/ru/companies/haulmont

    #AIагенты #Spring_Boot #skills_для_AIагентов #Spring_Agent_Toolkit #активация_skills #YAML_frontmatter #prompt_engineering

  21. Skills для AI-агентов: всё, что тебе нужно знать

    Добавляя новый Skill, мы ждем от агента простого результата: меньше ошибок, более стабильная работа и лучшее понимание библиотек и фреймворков. На практике же часто можно наблюдать: – один skill активируется почти всегда, даже когда не нужен – другой — не включается в момент, когда мы на него рассчитываем – третий — срабатывает «в паре» с соседними и они мешают друг другу В какой-то момент может показаться, что агент работает хаотично и явно хуже, и хочется выключить все skills и вернуться к первоначальному состоянию. Почему так происходит и что с этим можно сделать, разбираемся в статье.

    habr.com/ru/companies/haulmont

    #AIагенты #Spring_Boot #skills_для_AIагентов #Spring_Agent_Toolkit #активация_skills #YAML_frontmatter #prompt_engineering

  22. Парадокс GPT-5.5: чем подробнее промт — тем хуже. Разобрал свой 663-строчный скилл и сверился с Claude

    OpenAI выкатил гайд по промтингу GPT-5.5. Главный тезис: длинные простыни инструкций с ALWAYS/NEVER/MUST не помогают модели — они мешают. Чем подробнее зажимаешь процесс, тем хуже результат. Я полез проверять. Открыл свой рабочий скилл — process-logs, обработка логов ошибок, версия 1.9.0, продакшн. 663 строки, 36 капс-блоков: «CRITICAL REQUIREMENTS», «YOU MUST FOLLOW THESE RULES. NO EXCEPTIONS». Каждый раздел начинается с MANDATORY. Перечитал по новым правилам OpenAI и нашёл четыре проблемы в одной секции из 134 слов: дублирующиеся императивы на одну мысль, judgment-call под видом invariant, нет stopping condition. Переписал — стало 50 слов. На Opus 4.7 и GPT-5.5 короткий вариант даёт лучший фикс на одной и той же ошибке из логов. В статье: разбор 5 ключевых тезисов гайда с прямыми цитатами, диф «до/после» на реальном продакшн-скилле, эксперимент в Google Stitch, который можно повторить за 5 минут, и сверка с тем, что говорит Anthropic про Claude.

    habr.com/ru/articles/1031498/

    #Claude_Code #prompt_engineering #GPT5 #OpenAI #AIагенты #Anthropic #Claude

  23. Парадокс GPT-5.5: чем подробнее промт — тем хуже. Разобрал свой 663-строчный скилл и сверился с Claude

    OpenAI выкатил гайд по промтингу GPT-5.5. Главный тезис: длинные простыни инструкций с ALWAYS/NEVER/MUST не помогают модели — они мешают. Чем подробнее зажимаешь процесс, тем хуже результат. Я полез проверять. Открыл свой рабочий скилл — process-logs, обработка логов ошибок, версия 1.9.0, продакшн. 663 строки, 36 капс-блоков: «CRITICAL REQUIREMENTS», «YOU MUST FOLLOW THESE RULES. NO EXCEPTIONS». Каждый раздел начинается с MANDATORY. Перечитал по новым правилам OpenAI и нашёл четыре проблемы в одной секции из 134 слов: дублирующиеся императивы на одну мысль, judgment-call под видом invariant, нет stopping condition. Переписал — стало 50 слов. На Opus 4.7 и GPT-5.5 короткий вариант даёт лучший фикс на одной и той же ошибке из логов. В статье: разбор 5 ключевых тезисов гайда с прямыми цитатами, диф «до/после» на реальном продакшн-скилле, эксперимент в Google Stitch, который можно повторить за 5 минут, и сверка с тем, что говорит Anthropic про Claude.

    habr.com/ru/articles/1031498/

    #Claude_Code #prompt_engineering #GPT5 #OpenAI #AIагенты #Anthropic #Claude

  24. Парадокс GPT-5.5: чем подробнее промт — тем хуже. Разобрал свой 663-строчный скилл и сверился с Claude

    OpenAI выкатил гайд по промтингу GPT-5.5. Главный тезис: длинные простыни инструкций с ALWAYS/NEVER/MUST не помогают модели — они мешают. Чем подробнее зажимаешь процесс, тем хуже результат. Я полез проверять. Открыл свой рабочий скилл — process-logs, обработка логов ошибок, версия 1.9.0, продакшн. 663 строки, 36 капс-блоков: «CRITICAL REQUIREMENTS», «YOU MUST FOLLOW THESE RULES. NO EXCEPTIONS». Каждый раздел начинается с MANDATORY. Перечитал по новым правилам OpenAI и нашёл четыре проблемы в одной секции из 134 слов: дублирующиеся императивы на одну мысль, judgment-call под видом invariant, нет stopping condition. Переписал — стало 50 слов. На Opus 4.7 и GPT-5.5 короткий вариант даёт лучший фикс на одной и той же ошибке из логов. В статье: разбор 5 ключевых тезисов гайда с прямыми цитатами, диф «до/после» на реальном продакшн-скилле, эксперимент в Google Stitch, который можно повторить за 5 минут, и сверка с тем, что говорит Anthropic про Claude.

    habr.com/ru/articles/1031498/

    #Claude_Code #prompt_engineering #GPT5 #OpenAI #AIагенты #Anthropic #Claude

  25. Парадокс GPT-5.5: чем подробнее промт — тем хуже. Разобрал свой 663-строчный скилл и сверился с Claude

    OpenAI выкатил гайд по промтингу GPT-5.5. Главный тезис: длинные простыни инструкций с ALWAYS/NEVER/MUST не помогают модели — они мешают. Чем подробнее зажимаешь процесс, тем хуже результат. Я полез проверять. Открыл свой рабочий скилл — process-logs, обработка логов ошибок, версия 1.9.0, продакшн. 663 строки, 36 капс-блоков: «CRITICAL REQUIREMENTS», «YOU MUST FOLLOW THESE RULES. NO EXCEPTIONS». Каждый раздел начинается с MANDATORY. Перечитал по новым правилам OpenAI и нашёл четыре проблемы в одной секции из 134 слов: дублирующиеся императивы на одну мысль, judgment-call под видом invariant, нет stopping condition. Переписал — стало 50 слов. На Opus 4.7 и GPT-5.5 короткий вариант даёт лучший фикс на одной и той же ошибке из логов. В статье: разбор 5 ключевых тезисов гайда с прямыми цитатами, диф «до/после» на реальном продакшн-скилле, эксперимент в Google Stitch, который можно повторить за 5 минут, и сверка с тем, что говорит Anthropic про Claude.

    habr.com/ru/articles/1031498/

    #Claude_Code #prompt_engineering #GPT5 #OpenAI #AIагенты #Anthropic #Claude

  26. Почему ваш LLM-бот врёт клиентам — и паттерн, который это чинит

    Air Canada проиграла суд за слова чат-бота. Дилер Chevrolet «продал» Tahoe за доллар. Корень один: LLM одновременно решает что сказать и как. Под давлением точность проигрывает беглости. Разбор паттерна, который это чинит.

    habr.com/ru/articles/1027080/

    #llm #большие_языковые_модели #чатботы #aiагенты #prompt_engineering #архитектура_по #sycophancyeval #галлюцинации_llm #prompt_injection #triageandvoice

  27. Почему ваш LLM-бот врёт клиентам — и паттерн, который это чинит

    Air Canada проиграла суд за слова чат-бота. Дилер Chevrolet «продал» Tahoe за доллар. Корень один: LLM одновременно решает что сказать и как. Под давлением точность проигрывает беглости. Разбор паттерна, который это чинит.

    habr.com/ru/articles/1027080/

    #llm #большие_языковые_модели #чатботы #aiагенты #prompt_engineering #архитектура_по #sycophancyeval #галлюцинации_llm #prompt_injection #triageandvoice

  28. Почему ваш LLM-бот врёт клиентам — и паттерн, который это чинит

    Air Canada проиграла суд за слова чат-бота. Дилер Chevrolet «продал» Tahoe за доллар. Корень один: LLM одновременно решает что сказать и как. Под давлением точность проигрывает беглости. Разбор паттерна, который это чинит.

    habr.com/ru/articles/1027080/

    #llm #большие_языковые_модели #чатботы #aiагенты #prompt_engineering #архитектура_по #sycophancyeval #галлюцинации_llm #prompt_injection #triageandvoice

  29. Почему ваш LLM-бот врёт клиентам — и паттерн, который это чинит

    Air Canada проиграла суд за слова чат-бота. Дилер Chevrolet «продал» Tahoe за доллар. Корень один: LLM одновременно решает что сказать и как. Под давлением точность проигрывает беглости. Разбор паттерна, который это чинит.

    habr.com/ru/articles/1027080/

    #llm #большие_языковые_модели #чатботы #aiагенты #prompt_engineering #архитектура_по #sycophancyeval #галлюцинации_llm #prompt_injection #triageandvoice

  30. От NLU-бота к ИИ-агенту: как мы пробили потолок автоматизации в поддержке крупного банка

    Привет, Хабр! На связи команда Just AI. Когда NLU-сценарий вырастает до нескольких сотен веток, а процент автоматизации все равно не двигается — это не проблема настройки, это потолок технологии. Рассказываем, как мы помогли крупному банку его пробить: перевели поддержку по кешбэку на LLM-агентов, добавили агента-судью против галлюцинаций и улучшили понимание семантики и контекста пользовательских запросов.

    habr.com/ru/companies/just_ai/

    #мультиагентные_системы #conversational_ai #автоматизация_поддержки #машинное_обучение_нейросети #финтех #банки #ai #prompt_engineering #ииагенты #ai_agents

  31. От NLU-бота к ИИ-агенту: как мы пробили потолок автоматизации в поддержке крупного банка

    Привет, Хабр! На связи команда Just AI. Когда NLU-сценарий вырастает до нескольких сотен веток, а процент автоматизации все равно не двигается — это не проблема настройки, это потолок технологии. Рассказываем, как мы помогли крупному банку его пробить: перевели поддержку по кешбэку на LLM-агентов, добавили агента-судью против галлюцинаций и улучшили понимание семантики и контекста пользовательских запросов.

    habr.com/ru/companies/just_ai/

    #мультиагентные_системы #conversational_ai #автоматизация_поддержки #машинное_обучение_нейросети #финтех #банки #ai #prompt_engineering #ииагенты #ai_agents

  32. От NLU-бота к ИИ-агенту: как мы пробили потолок автоматизации в поддержке крупного банка

    Привет, Хабр! На связи команда Just AI. Когда NLU-сценарий вырастает до нескольких сотен веток, а процент автоматизации все равно не двигается — это не проблема настройки, это потолок технологии. Рассказываем, как мы помогли крупному банку его пробить: перевели поддержку по кешбэку на LLM-агентов, добавили агента-судью против галлюцинаций и улучшили понимание семантики и контекста пользовательских запросов.

    habr.com/ru/companies/just_ai/

    #мультиагентные_системы #conversational_ai #автоматизация_поддержки #машинное_обучение_нейросети #финтех #банки #ai #prompt_engineering #ииагенты #ai_agents

  33. От NLU-бота к ИИ-агенту: как мы пробили потолок автоматизации в поддержке крупного банка

    Привет, Хабр! На связи команда Just AI. Когда NLU-сценарий вырастает до нескольких сотен веток, а процент автоматизации все равно не двигается — это не проблема настройки, это потолок технологии. Рассказываем, как мы помогли крупному банку его пробить: перевели поддержку по кешбэку на LLM-агентов, добавили агента-судью против галлюцинаций и улучшили понимание семантики и контекста пользовательских запросов.

    habr.com/ru/companies/just_ai/

    #мультиагентные_системы #conversational_ai #автоматизация_поддержки #машинное_обучение_нейросети #финтех #банки #ai #prompt_engineering #ииагенты #ai_agents

  34. Пишем прототип ИИ-агента для EdTech-саппорта без векторных баз и фреймворков: чистый Python, Gemini и JSON

    У любого EdTech продукта есть проблема поддержки студентов. Я и сам столкнулся с ней в мою бытность автором курсов на степик. Студенты сталкиваются с трудностями и пишут в чат / на форум в надежде, что им помогут (особенно, если они заплатили за обучение свои кровные). Традиционный способ решения данной проблемы - куратор. Это человек, достаточно хорошо разбирающийся в предмете и структуре курса, задача которого отвечать на такие вопросы студентов. К сожалению, такой способ решения обладает радом недостатков, обусловленными человеческим фактором. Однако, в эпоху развития технологий искусственного интеллекта появился новый способ решения проблемы поддержки студентов. Прототип такого решения я недавно собрал и хочу вам об этом рассказать.

    habr.com/ru/articles/1029542/

    #llm #ai #gemini #rag #телеграмбот #python #edtech #prompt_engineering

  35. 10 настроек Claude Code, до которых большинство разработчиков не доходит

    Ранее я писал про утечку исходного кода Claude Code . 512 000 строк, KAIROS, упоминания нерелизнутых моделей Opus 4.7 и Sonnet 4.8. Так вот. В актуальном Claude Code уже есть Opus 4.7 . Ровно как и было в leaked-коде. Вместе с ней появился новый уровень /effort xhigh - это мы сегодня тоже разберём. В первой части я показал что Claude Code умеет из коробки. Типовой сценарий после этого: "понял, установил, пользуюсь". И дальше тот же потолок что у всех - Claude работает быстро, но как-то странно. Отвечает не то, повторяет одно и то же к концу сессии, просит разрешения на каждый чих, жрёт токены как не в себя. Это решается настройками. Конкретными. Которые лежат в двух файлах и никто до них не доходит. Ниже десять вещей которые я настроил за полгода работы с Claude Code и которые сделали разницу между "работает" и "работает как отдел". С готовыми конфигами. Копируй, вставляй, меняй под себя.

    habr.com/ru/articles/1028988/

    #claude_code #anthropic #opus_47 #ai_agents #ai_coding #developer_tools #prompt_engineering #hooks #claudemd #vibecoding

  36. 10 настроек Claude Code, до которых большинство разработчиков не доходит

    Ранее я писал про утечку исходного кода Claude Code . 512 000 строк, KAIROS, упоминания нерелизнутых моделей Opus 4.7 и Sonnet 4.8. Так вот. В актуальном Claude Code уже есть Opus 4.7 . Ровно как и было в leaked-коде. Вместе с ней появился новый уровень /effort xhigh - это мы сегодня тоже разберём. В первой части я показал что Claude Code умеет из коробки. Типовой сценарий после этого: "понял, установил, пользуюсь". И дальше тот же потолок что у всех - Claude работает быстро, но как-то странно. Отвечает не то, повторяет одно и то же к концу сессии, просит разрешения на каждый чих, жрёт токены как не в себя. Это решается настройками. Конкретными. Которые лежат в двух файлах и никто до них не доходит. Ниже десять вещей которые я настроил за полгода работы с Claude Code и которые сделали разницу между "работает" и "работает как отдел". С готовыми конфигами. Копируй, вставляй, меняй под себя.

    habr.com/ru/articles/1028988/

    #claude_code #anthropic #opus_47 #ai_agents #ai_coding #developer_tools #prompt_engineering #hooks #claudemd #vibecoding

  37. 10 настроек Claude Code, до которых большинство разработчиков не доходит

    Ранее я писал про утечку исходного кода Claude Code . 512 000 строк, KAIROS, упоминания нерелизнутых моделей Opus 4.7 и Sonnet 4.8. Так вот. В актуальном Claude Code уже есть Opus 4.7 . Ровно как и было в leaked-коде. Вместе с ней появился новый уровень /effort xhigh - это мы сегодня тоже разберём. В первой части я показал что Claude Code умеет из коробки. Типовой сценарий после этого: "понял, установил, пользуюсь". И дальше тот же потолок что у всех - Claude работает быстро, но как-то странно. Отвечает не то, повторяет одно и то же к концу сессии, просит разрешения на каждый чих, жрёт токены как не в себя. Это решается настройками. Конкретными. Которые лежат в двух файлах и никто до них не доходит. Ниже десять вещей которые я настроил за полгода работы с Claude Code и которые сделали разницу между "работает" и "работает как отдел". С готовыми конфигами. Копируй, вставляй, меняй под себя.

    habr.com/ru/articles/1028988/

    #claude_code #anthropic #opus_47 #ai_agents #ai_coding #developer_tools #prompt_engineering #hooks #claudemd #vibecoding

  38. 10 настроек Claude Code, до которых большинство разработчиков не доходит

    Ранее я писал про утечку исходного кода Claude Code . 512 000 строк, KAIROS, упоминания нерелизнутых моделей Opus 4.7 и Sonnet 4.8. Так вот. В актуальном Claude Code уже есть Opus 4.7 . Ровно как и было в leaked-коде. Вместе с ней появился новый уровень /effort xhigh - это мы сегодня тоже разберём. В первой части я показал что Claude Code умеет из коробки. Типовой сценарий после этого: "понял, установил, пользуюсь". И дальше тот же потолок что у всех - Claude работает быстро, но как-то странно. Отвечает не то, повторяет одно и то же к концу сессии, просит разрешения на каждый чих, жрёт токены как не в себя. Это решается настройками. Конкретными. Которые лежат в двух файлах и никто до них не доходит. Ниже десять вещей которые я настроил за полгода работы с Claude Code и которые сделали разницу между "работает" и "работает как отдел". С готовыми конфигами. Копируй, вставляй, меняй под себя.

    habr.com/ru/articles/1028988/

    #claude_code #anthropic #opus_47 #ai_agents #ai_coding #developer_tools #prompt_engineering #hooks #claudemd #vibecoding

  39. Mode collapse в авто-блоге: четыре пятницы подряд LLM приносила нам один и тот же «спорный вопрос про ИИ»

    Это история про открытый креативный промпт к LLM, оставленный без присмотра. Через месяц он превратил пятничную рубрику нашего блога в гимнастику парафразов одного и того же тезиса. Поймал я это не на первой пятнице и даже не на второй: каждая отдельная статья сама по себе выглядела нормально. На четвёртой стало очевидно. Расскажу, какие четыре вещи я попробовал, прежде чем признать, что промпт-инжинирингом эту штуку не лечат. По дороге всплыло, что часть проблемы сидела не в промпте, а в нашей собственной конфигурации Gemini, на которую я не сразу обратил внимание (точнее - вообще не видел). И как в итоге мы перевели генератор тем с открытого «придумай вопрос» на заранее детерминированную ротацию из курируемого пула. Без файнтюна, без RAG, без переезда на другую модель.

    habr.com/ru/articles/1028536/

    #mode_collapse #LLM #prompt_engineering #Gemini #temperature #промптинжиниринг #автогенерация_контента #Nodejs #AI #API

  40. Mode collapse в авто-блоге: четыре пятницы подряд LLM приносила нам один и тот же «спорный вопрос про ИИ»

    Это история про открытый креативный промпт к LLM, оставленный без присмотра. Через месяц он превратил пятничную рубрику нашего блога в гимнастику парафразов одного и того же тезиса. Поймал я это не на первой пятнице и даже не на второй: каждая отдельная статья сама по себе выглядела нормально. На четвёртой стало очевидно. Расскажу, какие четыре вещи я попробовал, прежде чем признать, что промпт-инжинирингом эту штуку не лечат. По дороге всплыло, что часть проблемы сидела не в промпте, а в нашей собственной конфигурации Gemini, на которую я не сразу обратил внимание (точнее - вообще не видел). И как в итоге мы перевели генератор тем с открытого «придумай вопрос» на заранее детерминированную ротацию из курируемого пула. Без файнтюна, без RAG, без переезда на другую модель.

    habr.com/ru/articles/1028536/

    #mode_collapse #LLM #prompt_engineering #Gemini #temperature #промптинжиниринг #автогенерация_контента #Nodejs #AI #API

  41. Mode collapse в авто-блоге: четыре пятницы подряд LLM приносила нам один и тот же «спорный вопрос про ИИ»

    Это история про открытый креативный промпт к LLM, оставленный без присмотра. Через месяц он превратил пятничную рубрику нашего блога в гимнастику парафразов одного и того же тезиса. Поймал я это не на первой пятнице и даже не на второй: каждая отдельная статья сама по себе выглядела нормально. На четвёртой стало очевидно. Расскажу, какие четыре вещи я попробовал, прежде чем признать, что промпт-инжинирингом эту штуку не лечат. По дороге всплыло, что часть проблемы сидела не в промпте, а в нашей собственной конфигурации Gemini, на которую я не сразу обратил внимание (точнее - вообще не видел). И как в итоге мы перевели генератор тем с открытого «придумай вопрос» на заранее детерминированную ротацию из курируемого пула. Без файнтюна, без RAG, без переезда на другую модель.

    habr.com/ru/articles/1028536/

    #mode_collapse #LLM #prompt_engineering #Gemini #temperature #промптинжиниринг #автогенерация_контента #Nodejs #AI #API

  42. Mode collapse в авто-блоге: четыре пятницы подряд LLM приносила нам один и тот же «спорный вопрос про ИИ»

    Это история про открытый креативный промпт к LLM, оставленный без присмотра. Через месяц он превратил пятничную рубрику нашего блога в гимнастику парафразов одного и того же тезиса. Поймал я это не на первой пятнице и даже не на второй: каждая отдельная статья сама по себе выглядела нормально. На четвёртой стало очевидно. Расскажу, какие четыре вещи я попробовал, прежде чем признать, что промпт-инжинирингом эту штуку не лечат. По дороге всплыло, что часть проблемы сидела не в промпте, а в нашей собственной конфигурации Gemini, на которую я не сразу обратил внимание (точнее - вообще не видел). И как в итоге мы перевели генератор тем с открытого «придумай вопрос» на заранее детерминированную ротацию из курируемого пула. Без файнтюна, без RAG, без переезда на другую модель.

    habr.com/ru/articles/1028536/

    #mode_collapse #LLM #prompt_engineering #Gemini #temperature #промптинжиниринг #автогенерация_контента #Nodejs #AI #API

  43. Новый LAMP, или почему ваш Agent Pipeline — это Apache в 2006 году

    Все усложняют работу с AI-агентами. А что если хватит markdown + git? Без LangChain, без VectorDB, без оркестраторов. Рассказываю что реально работает.

    habr.com/ru/articles/1028226/

    #AI_agent #LLM #pipeline #prompt_engineering #Design_by_Contract #методология_разработки #LangChain #RAG #developer_tools

  44. Новый LAMP, или почему ваш Agent Pipeline — это Apache в 2006 году

    Все усложняют работу с AI-агентами. А что если хватит markdown + git? Без LangChain, без VectorDB, без оркестраторов. Рассказываю что реально работает.

    habr.com/ru/articles/1028226/

    #AI_agent #LLM #pipeline #prompt_engineering #Design_by_Contract #методология_разработки #LangChain #RAG #developer_tools

  45. Новый LAMP, или почему ваш Agent Pipeline — это Apache в 2006 году

    Все усложняют работу с AI-агентами. А что если хватит markdown + git? Без LangChain, без VectorDB, без оркестраторов. Рассказываю что реально работает.

    habr.com/ru/articles/1028226/

    #AI_agent #LLM #pipeline #prompt_engineering #Design_by_Contract #методология_разработки #LangChain #RAG #developer_tools

  46. Новый LAMP, или почему ваш Agent Pipeline — это Apache в 2006 году

    Все усложняют работу с AI-агентами. А что если хватит markdown + git? Без LangChain, без VectorDB, без оркестраторов. Рассказываю что реально работает.

    habr.com/ru/articles/1028226/

    #AI_agent #LLM #pipeline #prompt_engineering #Design_by_Contract #методология_разработки #LangChain #RAG #developer_tools