home.social

#chainofthought — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #chainofthought, aggregated by home.social.

  1. Characterization of GPU-based Inference for Reasoning-Centric LLMs (Micron, Argonne) Researchers from Micron Technology and Argonne National Laboratory have released “Understanding Inference Scal...

    #AI/ML/DL #Memory #Power #& #Performance #Technical #Papers #Argonne #National #Laboratory #Chain-of-Thought

    Origin | Interest | Match
  2. I just want an agent. Часть 2. Как мы построили виртуальную команду для разработки ИИ-агентов

    В первой части я рассказывал про мета-агента — свой прототип системы, которая собирает ботов по описанию на естественном языке, и про то, как этот проект занял первое место на внутреннем конкурсе. Напомню концепцию: пользователь говорит «хочу бота» и отгружает требования, а агент проектирует архитектуру и отдает готовый JSON. Но конкурсный прототип и продакшен-система — это разные вещи. Чтобы реализовать такой функционал для корпоративных пользователей и тем более продавать, нужно сделать так, чтобы наш ИИ-агент для производства ИИ-агентов работал надежно, не один раз, не только на демокейсах и, самое главное, не вытворял что-нибудь неожиданное посреди рабочего процесса. Это значит, что нам нужна инженерная система — с ролями, инструментами, ограничителями и накопленным опытом. Вторая часть моего лонгрида как раз посвящена тому, как мы реализовали продакшен-решение для создания ИИ-агентов, которое впоследствии стало главным вайб-код-инструментом нашей платформы MWS AI Agents Platform и получило название «ИИ-команда» (AI Force). Велком под кат

    habr.com/ru/companies/ru_mts/a

    #ИИагент #метаагент #lowcode #nocode #LLM #промптинжиниринг #MCP #мультиагентная_система #ChainofThought #вайбкодинг

  3. I just want an agent. Часть 2. Как мы построили виртуальную команду для разработки ИИ-агентов

    В первой части я рассказывал про мета-агента — свой прототип системы, которая собирает ботов по описанию на естественном языке, и про то, как этот проект занял первое место на внутреннем конкурсе. Напомню концепцию: пользователь говорит «хочу бота» и отгружает требования, а агент проектирует архитектуру и отдает готовый JSON. Но конкурсный прототип и продакшен-система — это разные вещи. Чтобы реализовать такой функционал для корпоративных пользователей и тем более продавать, нужно сделать так, чтобы наш ИИ-агент для производства ИИ-агентов работал надежно, не один раз, не только на демокейсах и, самое главное, не вытворял что-нибудь неожиданное посреди рабочего процесса. Это значит, что нам нужна инженерная система — с ролями, инструментами, ограничителями и накопленным опытом. Вторая часть моего лонгрида как раз посвящена тому, как мы реализовали продакшен-решение для создания ИИ-агентов, которое впоследствии стало главным вайб-код-инструментом нашей платформы MWS AI Agents Platform и получило название «ИИ-команда» (AI Force). Велком под кат

    habr.com/ru/companies/ru_mts/a

    #ИИагент #метаагент #lowcode #nocode #LLM #промптинжиниринг #MCP #мультиагентная_система #ChainofThought #вайбкодинг

  4. I just want an agent. Часть 2. Как мы построили виртуальную команду для разработки ИИ-агентов

    В первой части я рассказывал про мета-агента — свой прототип системы, которая собирает ботов по описанию на естественном языке, и про то, как этот проект занял первое место на внутреннем конкурсе. Напомню концепцию: пользователь говорит «хочу бота» и отгружает требования, а агент проектирует архитектуру и отдает готовый JSON. Но конкурсный прототип и продакшен-система — это разные вещи. Чтобы реализовать такой функционал для корпоративных пользователей и тем более продавать, нужно сделать так, чтобы наш ИИ-агент для производства ИИ-агентов работал надежно, не один раз, не только на демокейсах и, самое главное, не вытворял что-нибудь неожиданное посреди рабочего процесса. Это значит, что нам нужна инженерная система — с ролями, инструментами, ограничителями и накопленным опытом. Вторая часть моего лонгрида как раз посвящена тому, как мы реализовали продакшен-решение для создания ИИ-агентов, которое впоследствии стало главным вайб-код-инструментом нашей платформы MWS AI Agents Platform и получило название «ИИ-команда» (AI Force). Велком под кат

    habr.com/ru/companies/ru_mts/a

    #ИИагент #метаагент #lowcode #nocode #LLM #промптинжиниринг #MCP #мультиагентная_система #ChainofThought #вайбкодинг

  5. I just want an agent. Часть 2. Как мы построили виртуальную команду для разработки ИИ-агентов

    В первой части я рассказывал про мета-агента — свой прототип системы, которая собирает ботов по описанию на естественном языке, и про то, как этот проект занял первое место на внутреннем конкурсе. Напомню концепцию: пользователь говорит «хочу бота» и отгружает требования, а агент проектирует архитектуру и отдает готовый JSON. Но конкурсный прототип и продакшен-система — это разные вещи. Чтобы реализовать такой функционал для корпоративных пользователей и тем более продавать, нужно сделать так, чтобы наш ИИ-агент для производства ИИ-агентов работал надежно, не один раз, не только на демокейсах и, самое главное, не вытворял что-нибудь неожиданное посреди рабочего процесса. Это значит, что нам нужна инженерная система — с ролями, инструментами, ограничителями и накопленным опытом. Вторая часть моего лонгрида как раз посвящена тому, как мы реализовали продакшен-решение для создания ИИ-агентов, которое впоследствии стало главным вайб-код-инструментом нашей платформы MWS AI Agents Platform и получило название «ИИ-команда» (AI Force). Велком под кат

    habr.com/ru/companies/ru_mts/a

    #ИИагент #метаагент #lowcode #nocode #LLM #промптинжиниринг #MCP #мультиагентная_система #ChainofThought #вайбкодинг

  6. I just want an agent. Часть 1. Как я научил ИИ собирать ИИ-агентов за пользователей и выиграл конкурс

    Привет, Хабр! Меня зовут Данила Катальшов, я технический лидер команды промпт-инженеров MWS AI. В конце прошлого года мы (в значении MWS AI) выпустили собственную платформу для сборки ИИ-агентов — MWS AI Agents Platform. Платформа избавляет от необходимости разбираться в программировании — можно собирать нужного бота, ИИ-агента или мультиагентную систему, просто перетаскивая блоки в визуальном конструкторе. Однако для работы на ней все равно нужно было инженерное мышление, по меньшей мере на уровне понимания циклов создания ИИ-решений, типов данных, связей между различными компонентами и прочее. Чтобы закрыть этот общий гэп low-code-платформ, в рамках внутреннего корпоративного конкурса я собрал мета-агента (Meta Agent) — систему, где ИИ-агент выступает архитектором и собирает других агентов по текстовому описанию. В итоге проект занял первое место и, что более важно, потом мы с командой запилили уже полноценный аналогичный (ну почти) функционал для нашей MWS AI Agents Platform, который выкатили вот буквально на днях. В этой части лонгрида речь пойдет о моем конкурсном проекте. А во второй — уже будет история о том, как реализован аналогичный вайб-код-функционал на платформе. Поехали!

    habr.com/ru/companies/mts_ai/a

    #ИИагент #метаагент #lowcode #nocode #LLM #промптинжиниринг #MCP #мультиагентная_система #ChainofThought #вайбкодинг

  7. I just want an agent. Часть 1. Как я научил ИИ собирать ИИ-агентов за пользователей и выиграл конкурс

    Привет, Хабр! Меня зовут Данила Катальшов, я технический лидер команды промпт-инженеров MWS AI. В конце прошлого года мы (в значении MWS AI) выпустили собственную платформу для сборки ИИ-агентов — MWS AI Agents Platform. Платформа избавляет от необходимости разбираться в программировании — можно собирать нужного бота, ИИ-агента или мультиагентную систему, просто перетаскивая блоки в визуальном конструкторе. Однако для работы на ней все равно нужно было инженерное мышление, по меньшей мере на уровне понимания циклов создания ИИ-решений, типов данных, связей между различными компонентами и прочее. Чтобы закрыть этот общий гэп low-code-платформ, в рамках внутреннего корпоративного конкурса я собрал мета-агента (Meta Agent) — систему, где ИИ-агент выступает архитектором и собирает других агентов по текстовому описанию. В итоге проект занял первое место и, что более важно, потом мы с командой запилили уже полноценный аналогичный (ну почти) функционал для нашей MWS AI Agents Platform, который выкатили вот буквально на днях. В этой части лонгрида речь пойдет о моем конкурсном проекте. А во второй — уже будет история о том, как реализован аналогичный вайб-код-функционал на платформе. Поехали!

    habr.com/ru/companies/mts_ai/a

    #ИИагент #метаагент #lowcode #nocode #LLM #промптинжиниринг #MCP #мультиагентная_система #ChainofThought #вайбкодинг

  8. I just want an agent. Часть 1. Как я научил ИИ собирать ИИ-агентов за пользователей и выиграл конкурс

    Привет, Хабр! Меня зовут Данила Катальшов, я технический лидер команды промпт-инженеров MWS AI. В конце прошлого года мы (в значении MWS AI) выпустили собственную платформу для сборки ИИ-агентов — MWS AI Agents Platform. Платформа избавляет от необходимости разбираться в программировании — можно собирать нужного бота, ИИ-агента или мультиагентную систему, просто перетаскивая блоки в визуальном конструкторе. Однако для работы на ней все равно нужно было инженерное мышление, по меньшей мере на уровне понимания циклов создания ИИ-решений, типов данных, связей между различными компонентами и прочее. Чтобы закрыть этот общий гэп low-code-платформ, в рамках внутреннего корпоративного конкурса я собрал мета-агента (Meta Agent) — систему, где ИИ-агент выступает архитектором и собирает других агентов по текстовому описанию. В итоге проект занял первое место и, что более важно, потом мы с командой запилили уже полноценный аналогичный (ну почти) функционал для нашей MWS AI Agents Platform, который выкатили вот буквально на днях. В этой части лонгрида речь пойдет о моем конкурсном проекте. А во второй — уже будет история о том, как реализован аналогичный вайб-код-функционал на платформе. Поехали!

    habr.com/ru/companies/mts_ai/a

    #ИИагент #метаагент #lowcode #nocode #LLM #промптинжиниринг #MCP #мультиагентная_система #ChainofThought #вайбкодинг

  9. I just want an agent. Часть 1. Как я научил ИИ собирать ИИ-агентов за пользователей и выиграл конкурс

    Привет, Хабр! Меня зовут Данила Катальшов, я технический лидер команды промпт-инженеров MWS AI. В конце прошлого года мы (в значении MWS AI) выпустили собственную платформу для сборки ИИ-агентов — MWS AI Agents Platform. Платформа избавляет от необходимости разбираться в программировании — можно собирать нужного бота, ИИ-агента или мультиагентную систему, просто перетаскивая блоки в визуальном конструкторе. Однако для работы на ней все равно нужно было инженерное мышление, по меньшей мере на уровне понимания циклов создания ИИ-решений, типов данных, связей между различными компонентами и прочее. Чтобы закрыть этот общий гэп low-code-платформ, в рамках внутреннего корпоративного конкурса я собрал мета-агента (Meta Agent) — систему, где ИИ-агент выступает архитектором и собирает других агентов по текстовому описанию. В итоге проект занял первое место и, что более важно, потом мы с командой запилили уже полноценный аналогичный (ну почти) функционал для нашей MWS AI Agents Platform, который выкатили вот буквально на днях. В этой части лонгрида речь пойдет о моем конкурсном проекте. А во второй — уже будет история о том, как реализован аналогичный вайб-код-функционал на платформе. Поехали!

    habr.com/ru/companies/mts_ai/a

    #ИИагент #метаагент #lowcode #nocode #LLM #промптинжиниринг #MCP #мультиагентная_система #ChainofThought #вайбкодинг

  10. Reasoning-модели сломали мой промпт-инжиниринг. Год переучиваюсь

    Вторник, час ночи. Закидываю в GPT-5.5 свой проверенный шаблон с развёрнутым CoT, тремя few-shot, ролью «опытный аналитик». Получаю мусор. Удаляю весь промпт, пишу из трёх строк — работает. Минут десять пялюсь в монитор. Половина моего трёхлетнего арсенала против reasoning-моделей либо лишняя, либо вредит. Что сдохло, что наоборот выросло в значимости, что писать под какую задачу. Без эмоциональной role-play и многословных «подумай шаг за шагом» — они сейчас только тормозят.

    habr.com/ru/articles/1038510/

    #промптинжиниринг #reasoningмодели #gpt55 #claude_opus #llm #chainofthought #fewshot #aiагенты

  11. Reasoning-модели сломали мой промпт-инжиниринг. Год переучиваюсь

    Вторник, час ночи. Закидываю в GPT-5.5 свой проверенный шаблон с развёрнутым CoT, тремя few-shot, ролью «опытный аналитик». Получаю мусор. Удаляю весь промпт, пишу из трёх строк — работает. Минут десять пялюсь в монитор. Половина моего трёхлетнего арсенала против reasoning-моделей либо лишняя, либо вредит. Что сдохло, что наоборот выросло в значимости, что писать под какую задачу. Без эмоциональной role-play и многословных «подумай шаг за шагом» — они сейчас только тормозят.

    habr.com/ru/articles/1038510/

    #промптинжиниринг #reasoningмодели #gpt55 #claude_opus #llm #chainofthought #fewshot #aiагенты

  12. Reasoning-модели сломали мой промпт-инжиниринг. Год переучиваюсь

    Вторник, час ночи. Закидываю в GPT-5.5 свой проверенный шаблон с развёрнутым CoT, тремя few-shot, ролью «опытный аналитик». Получаю мусор. Удаляю весь промпт, пишу из трёх строк — работает. Минут десять пялюсь в монитор. Половина моего трёхлетнего арсенала против reasoning-моделей либо лишняя, либо вредит. Что сдохло, что наоборот выросло в значимости, что писать под какую задачу. Без эмоциональной role-play и многословных «подумай шаг за шагом» — они сейчас только тормозят.

    habr.com/ru/articles/1038510/

    #промптинжиниринг #reasoningмодели #gpt55 #claude_opus #llm #chainofthought #fewshot #aiагенты

  13. Reasoning-модели сломали мой промпт-инжиниринг. Год переучиваюсь

    Вторник, час ночи. Закидываю в GPT-5.5 свой проверенный шаблон с развёрнутым CoT, тремя few-shot, ролью «опытный аналитик». Получаю мусор. Удаляю весь промпт, пишу из трёх строк — работает. Минут десять пялюсь в монитор. Половина моего трёхлетнего арсенала против reasoning-моделей либо лишняя, либо вредит. Что сдохло, что наоборот выросло в значимости, что писать под какую задачу. Без эмоциональной role-play и многословных «подумай шаг за шагом» — они сейчас только тормозят.

    habr.com/ru/articles/1038510/

    #промптинжиниринг #reasoningмодели #gpt55 #claude_opus #llm #chainofthought #fewshot #aiагенты

  14. Промпт-инжиниринг 2026: что устарело с приходом reasoning-моделей

    Половина моих промпт-техник за пару лет работы с GPT-4 и Claude 3.5 на reasoning-моделях работает хуже минимального промпта. Развёрнутый chain-of-thought, многошаговый few-shot, эмоциональная role-play — лишнее или вредит. А скучные техники — контракт результата, системные промпты, constraints — наоборот, стали критически важными. Что умерло, что выжило, что подходит под какую задачу.

    habr.com/ru/articles/1034572/

    #промптинжиниринг #reasoningмодели #gpt55 #claude_opus #llm #chainofthought

  15. Промпт-инжиниринг 2026: что устарело с приходом reasoning-моделей

    Половина моих промпт-техник за пару лет работы с GPT-4 и Claude 3.5 на reasoning-моделях работает хуже минимального промпта. Развёрнутый chain-of-thought, многошаговый few-shot, эмоциональная role-play — лишнее или вредит. А скучные техники — контракт результата, системные промпты, constraints — наоборот, стали критически важными. Что умерло, что выжило, что подходит под какую задачу.

    habr.com/ru/articles/1034572/

    #промптинжиниринг #reasoningмодели #gpt55 #claude_opus #llm #chainofthought

  16. Промпт-инжиниринг 2026: что устарело с приходом reasoning-моделей

    Половина моих промпт-техник за пару лет работы с GPT-4 и Claude 3.5 на reasoning-моделях работает хуже минимального промпта. Развёрнутый chain-of-thought, многошаговый few-shot, эмоциональная role-play — лишнее или вредит. А скучные техники — контракт результата, системные промпты, constraints — наоборот, стали критически важными. Что умерло, что выжило, что подходит под какую задачу.

    habr.com/ru/articles/1034572/

    #промптинжиниринг #reasoningмодели #gpt55 #claude_opus #llm #chainofthought

  17. Промпт-инжиниринг 2026: что устарело с приходом reasoning-моделей

    Половина моих промпт-техник за пару лет работы с GPT-4 и Claude 3.5 на reasoning-моделях работает хуже минимального промпта. Развёрнутый chain-of-thought, многошаговый few-shot, эмоциональная role-play — лишнее или вредит. А скучные техники — контракт результата, системные промпты, constraints — наоборот, стали критически важными. Что умерло, что выжило, что подходит под какую задачу.

    habr.com/ru/articles/1034572/

    #промптинжиниринг #reasoningмодели #gpt55 #claude_opus #llm #chainofthought

  18. Иллюзия логики: как я доказал, что LLM-агенты игнорируют факты, и почему Chain-of-Thought делает только хуже

    Сейчас каждый второй стартап пилит ИИ-агентов. Мы оборачиваем LLM в цикл Промпт -> Вызов инструмента -> Ответ и ждем, что нейросеть сама расследует инцидент, найдет баг или напишет фичу. Но на практике автономные агенты часто ходят по кругу, игнорируют явные ошибки и «влюбляются» в свою первую догадку. Индустрия пытается лечить это костылями: наращивает контекст до миллионов токенов или заставляет модель «подумать шаг за шагом» (Chain-of-Thought). Я решил проверить эту архитектуру на прочность. Собрал локальный измерительный стенд LOCK-R, вооружился Теоремой Байеса и поймал современные LLM за руку. В этой статье я математически докажу, почему одиночные агенты структурно уязвимы, как токены размышлений заставляют их врать самим себе еще искуснее, и почему паттерн «Слепого Судьи» - это единственный способ вылечить AI от предвзятости. Тестируем на локальной Qwen-9B и фронтирной GPT-5.4.

    habr.com/ru/articles/1020016/

    #llm #ai_agents #rag #machine_learning #архитектура #chainofthought #теорема_байеса #gpt54 #qwen35 #бенчмарк

  19. Иллюзия логики: как я доказал, что LLM-агенты игнорируют факты, и почему Chain-of-Thought делает только хуже

    Сейчас каждый второй стартап пилит ИИ-агентов. Мы оборачиваем LLM в цикл Промпт -> Вызов инструмента -> Ответ и ждем, что нейросеть сама расследует инцидент, найдет баг или напишет фичу. Но на практике автономные агенты часто ходят по кругу, игнорируют явные ошибки и «влюбляются» в свою первую догадку. Индустрия пытается лечить это костылями: наращивает контекст до миллионов токенов или заставляет модель «подумать шаг за шагом» (Chain-of-Thought). Я решил проверить эту архитектуру на прочность. Собрал локальный измерительный стенд LOCK-R, вооружился Теоремой Байеса и поймал современные LLM за руку. В этой статье я математически докажу, почему одиночные агенты структурно уязвимы, как токены размышлений заставляют их врать самим себе еще искуснее, и почему паттерн «Слепого Судьи» - это единственный способ вылечить AI от предвзятости. Тестируем на локальной Qwen-9B и фронтирной GPT-5.4.

    habr.com/ru/articles/1020016/

    #llm #ai_agents #rag #machine_learning #архитектура #chainofthought #теорема_байеса #gpt54 #qwen35 #бенчмарк

  20. Иллюзия логики: как я доказал, что LLM-агенты игнорируют факты, и почему Chain-of-Thought делает только хуже

    Сейчас каждый второй стартап пилит ИИ-агентов. Мы оборачиваем LLM в цикл Промпт -> Вызов инструмента -> Ответ и ждем, что нейросеть сама расследует инцидент, найдет баг или напишет фичу. Но на практике автономные агенты часто ходят по кругу, игнорируют явные ошибки и «влюбляются» в свою первую догадку. Индустрия пытается лечить это костылями: наращивает контекст до миллионов токенов или заставляет модель «подумать шаг за шагом» (Chain-of-Thought). Я решил проверить эту архитектуру на прочность. Собрал локальный измерительный стенд LOCK-R, вооружился Теоремой Байеса и поймал современные LLM за руку. В этой статье я математически докажу, почему одиночные агенты структурно уязвимы, как токены размышлений заставляют их врать самим себе еще искуснее, и почему паттерн «Слепого Судьи» - это единственный способ вылечить AI от предвзятости. Тестируем на локальной Qwen-9B и фронтирной GPT-5.4.

    habr.com/ru/articles/1020016/

    #llm #ai_agents #rag #machine_learning #архитектура #chainofthought #теорема_байеса #gpt54 #qwen35 #бенчмарк

  21. Иллюзия логики: как я доказал, что LLM-агенты игнорируют факты, и почему Chain-of-Thought делает только хуже

    Сейчас каждый второй стартап пилит ИИ-агентов. Мы оборачиваем LLM в цикл Промпт -> Вызов инструмента -> Ответ и ждем, что нейросеть сама расследует инцидент, найдет баг или напишет фичу. Но на практике автономные агенты часто ходят по кругу, игнорируют явные ошибки и «влюбляются» в свою первую догадку. Индустрия пытается лечить это костылями: наращивает контекст до миллионов токенов или заставляет модель «подумать шаг за шагом» (Chain-of-Thought). Я решил проверить эту архитектуру на прочность. Собрал локальный измерительный стенд LOCK-R, вооружился Теоремой Байеса и поймал современные LLM за руку. В этой статье я математически докажу, почему одиночные агенты структурно уязвимы, как токены размышлений заставляют их врать самим себе еще искуснее, и почему паттерн «Слепого Судьи» - это единственный способ вылечить AI от предвзятости. Тестируем на локальной Qwen-9B и фронтирной GPT-5.4.

    habr.com/ru/articles/1020016/

    #llm #ai_agents #rag #machine_learning #архитектура #chainofthought #теорема_байеса #gpt54 #qwen35 #бенчмарк

  22. Chain-of-Thought (CoT) Prompting

    Chain-of-Thought (CoT) prompting is a technique where asking questions, rather than issuing direct instructions activates a model’s full internal reasoning pathway.

    The key insight from the original framing is that instructions skip steps 1–3, jumping straight to synthesis, while questions force the model to work through the entire reasoning chain.

    neurodoctor.com/2026/03/20/cha

    #chainofthought #cot #ai #llm #prompt #prompts #prompting #claude #chatgpt #gemini #ericschmidt

  23. Chain-of-Thought (CoT) Prompting

    Chain-of-Thought (CoT) prompting is a technique where asking questions, rather than issuing direct instructions activates a model’s full internal reasoning pathway.

    The key insight from the original framing is that instructions skip steps 1–3, jumping straight to synthesis, while questions force the model to work through the entire reasoning chain.

    neurodoctor.com/2026/03/20/cha

    #chainofthought #cot #ai #llm #prompt #prompts #prompting #claude #chatgpt #gemini #ericschmidt

  24. Chain-of-Thought (CoT) Prompting

    Chain-of-Thought (CoT) prompting is a technique where asking questions, rather than issuing direct instructions activates a model’s full internal reasoning pathway.

    The key insight from the original framing is that instructions skip steps 1–3, jumping straight to synthesis, while questions force the model to work through the entire reasoning chain.

    neurodoctor.com/2026/03/20/cha

    #chainofthought #cot #ai #llm #prompt #prompts #prompting #claude #chatgpt #gemini #ericschmidt

  25. Chain-of-Thought (CoT) Prompting

    Chain-of-Thought (CoT) prompting is a technique where asking questions, rather than issuing direct instructions activates a model’s full internal reasoning pathway.

    The key insight from the original framing is that instructions skip steps 1–3, jumping straight to synthesis, while questions force the model to work through the entire reasoning chain.

    neurodoctor.com/2026/03/20/cha

    #chainofthought #cot #ai #llm #prompt #prompts #prompting #claude #chatgpt #gemini #ericschmidt

  26. Chain-of-Thought (CoT) Prompting

    Chain-of-Thought (CoT) prompting is a technique where asking questions, rather than issuing direct instructions activates a model’s full internal reasoning pathway.

    The key insight from the original framing is that instructions skip steps 1–3, jumping straight to synthesis, while questions force the model to work through the entire reasoning chain.

    neurodoctor.com/2026/03/20/cha

    #chainofthought #cot #ai #llm #prompt #prompts #prompting #claude #chatgpt #gemini #ericschmidt

  27. New research shows TensorRT Edge‑LLM can run chain‑of‑thought reasoning directly on devices, boosting physical AI tasks like autonomous‑vehicle perception and MATH500 benchmarks. Efficient, on‑device inference means smarter, safer robots without cloud latency. Dive into the details of this breakthrough for on‑device language models. #TensorRT #EdgeLLM #ChainOfThought #PhysicalAI

    🔗 aidailypost.com/news/tensorrt-

  28. Chain of Thought bleibt sichtbar.

    Aktuelle Reasoning-Modelle können ihre internen Rechenschritte nicht vor Monitoring-Systemen verbergen. Studien zeigen, dass Versuche zur Verschleierung – etwa durch Keyword-Vermeidung – meist fehlschlagen. Besonders bei langen Rechenketten bricht die Kontrolle über die eigene Ausgabe zusammen. Die Analyse der Zwischenschritte bleibt damit ein valider Weg für Sicherheitschecks.

    #OpenAI #KISicherheit #ChainOfThought
    all-ai.de/news/beitrage2026/op

  29. The Hidden Cost of Thinking Harder: Why AI Reasoning Models Sometimes Get Dumber With More Compute New research reveals that AI reasoning models frequently waste computational resources on easy pro...

    #GenAIPro #AI #reasoning #models #chain-of-thought #reasoning #compute #efficiency #LLM #overthinking #test-time

    Origin | Interest | Match
  30. #EricJang argues that #AImodels can now genuinely think and code. Using #ClaudeCode, he demonstrates #automatedresearch workflows, traces reasoning’s evolution from #ChainofThought to #DeepSeekR1, and predicts massive demand for inference compute. #Codingagents will fundamentally transform #softwareengineering, #research, and #militarystrategy - “the rocks can think now.“​​​​​​​​​​​​​​​​ evjang.com/2026/02/04/rocks.ht #tech #media #news

  31. #EricJang argues that #AImodels can now genuinely think and code. Using #ClaudeCode, he demonstrates #automatedresearch workflows, traces reasoning’s evolution from #ChainofThought to #DeepSeekR1, and predicts massive demand for inference compute. #Codingagents will fundamentally transform #softwareengineering, #research, and #militarystrategy - “the rocks can think now.“​​​​​​​​​​​​​​​​ evjang.com/2026/02/04/rocks.ht #tech #media #news

  32. #EricJang argues that #AImodels can now genuinely think and code. Using #ClaudeCode, he demonstrates #automatedresearch workflows, traces reasoning’s evolution from #ChainofThought to #DeepSeekR1, and predicts massive demand for inference compute. #Codingagents will fundamentally transform #softwareengineering, #research, and #militarystrategy - “the rocks can think now.“​​​​​​​​​​​​​​​​ evjang.com/2026/02/04/rocks.ht #tech #media #news

  33. #EricJang argues that #AImodels can now genuinely think and code. Using #ClaudeCode, he demonstrates #automatedresearch workflows, traces reasoning’s evolution from #ChainofThought to #DeepSeekR1, and predicts massive demand for inference compute. #Codingagents will fundamentally transform #softwareengineering, #research, and #militarystrategy - “the rocks can think now.“​​​​​​​​​​​​​​​​ evjang.com/2026/02/04/rocks.ht #tech #media #news

  34. #EricJang argues that #AImodels can now genuinely think and code. Using #ClaudeCode, he demonstrates #automatedresearch workflows, traces reasoning’s evolution from #ChainofThought to #DeepSeekR1, and predicts massive demand for inference compute. #Codingagents will fundamentally transform #softwareengineering, #research, and #militarystrategy - “the rocks can think now.“​​​​​​​​​​​​​​​​ evjang.com/2026/02/04/rocks.ht #tech #media #news

  35. New research shows DeepSeek-R1 and QwQ-3 develop distinct personalities that boost chain-of-thought reasoning, hinting at a future where societies of thought among LLMs improve problem solving. Open-source enthusiasts, see how personality diversity reshapes AI reasoning! #DeepSeekR1 #QwQ32B #ChainOfThought #PersonalityDiversity

    🔗 aidailypost.com/news/deepseekr

  36. New research shows DeepSeek-R1 and QwQ-3 develop distinct personalities that boost chain-of-thought reasoning, hinting at a future where societies of thought among LLMs improve problem solving. Open-source enthusiasts, see how personality diversity reshapes AI reasoning! #DeepSeekR1 #QwQ32B #ChainOfThought #PersonalityDiversity

    🔗 aidailypost.com/news/deepseekr

  37. New research shows DeepSeek-R1 and QwQ-3 develop distinct personalities that boost chain-of-thought reasoning, hinting at a future where societies of thought among LLMs improve problem solving. Open-source enthusiasts, see how personality diversity reshapes AI reasoning! #DeepSeekR1 #QwQ32B #ChainOfThought #PersonalityDiversity

    🔗 aidailypost.com/news/deepseekr

  38. Общество мыслей: совещание внутри LLM

    DeepSeek-R1, QwQ-32B и OpenAI o1 показывают результаты, которые невозможно объяснить просто "более длинными рассуждениями". Исследователи из Google Research и University of Chicago обнаружили нечто неожиданное: внутри reasoning-моделей происходит не монолог, а настоящее совещание — симуляция многоперспективного диалога с конфликтами, дебатами и примирением. В статье разбираем: • Почему Chain-of-Thought недостаточен для сложных задач • Что такое Society of Thought и как модели воспроизводят коллективный интеллект • Четыре ключевых паттерна conversational dynamics (вопросы, смена перспектив, конфликт, примирение) • 12 социо-эмоциональных ролей по Bales' IPA, которые возникают в рассуждениях моделей • Diversity (разнообразие) перспектив и почему разнообразие точек зрения критично для accuracy (точности) • Результаты экспериментов: activation steering, RL-обучение и transfer effects Основной вывод: reasoning-модели спонтанно научились имитировать то, что философы и психологи описывали как природу мышления — внутренний диалог между разными голосами. И это работает лучше, чем линейное рассуждение.

    habr.com/ru/articles/987758/

    #LLM #reasoning #ChainofThought #DeepSeekR1 #QwQ32B #OpenAI_o1 #искусственный_интеллект #машинное_обучение #Society_of_Thought

  39. Общество мыслей: совещание внутри LLM

    DeepSeek-R1, QwQ-32B и OpenAI o1 показывают результаты, которые невозможно объяснить просто "более длинными рассуждениями". Исследователи из Google Research и University of Chicago обнаружили нечто неожиданное: внутри reasoning-моделей происходит не монолог, а настоящее совещание — симуляция многоперспективного диалога с конфликтами, дебатами и примирением. В статье разбираем: • Почему Chain-of-Thought недостаточен для сложных задач • Что такое Society of Thought и как модели воспроизводят коллективный интеллект • Четыре ключевых паттерна conversational dynamics (вопросы, смена перспектив, конфликт, примирение) • 12 социо-эмоциональных ролей по Bales' IPA, которые возникают в рассуждениях моделей • Diversity (разнообразие) перспектив и почему разнообразие точек зрения критично для accuracy (точности) • Результаты экспериментов: activation steering, RL-обучение и transfer effects Основной вывод: reasoning-модели спонтанно научились имитировать то, что философы и психологи описывали как природу мышления — внутренний диалог между разными голосами. И это работает лучше, чем линейное рассуждение.

    habr.com/ru/articles/987758/

    #LLM #reasoning #ChainofThought #DeepSeekR1 #QwQ32B #OpenAI_o1 #искусственный_интеллект #машинное_обучение #Society_of_Thought

  40. Общество мыслей: совещание внутри LLM

    DeepSeek-R1, QwQ-32B и OpenAI o1 показывают результаты, которые невозможно объяснить просто "более длинными рассуждениями". Исследователи из Google Research и University of Chicago обнаружили нечто неожиданное: внутри reasoning-моделей происходит не монолог, а настоящее совещание — симуляция многоперспективного диалога с конфликтами, дебатами и примирением. В статье разбираем: • Почему Chain-of-Thought недостаточен для сложных задач • Что такое Society of Thought и как модели воспроизводят коллективный интеллект • Четыре ключевых паттерна conversational dynamics (вопросы, смена перспектив, конфликт, примирение) • 12 социо-эмоциональных ролей по Bales' IPA, которые возникают в рассуждениях моделей • Diversity (разнообразие) перспектив и почему разнообразие точек зрения критично для accuracy (точности) • Результаты экспериментов: activation steering, RL-обучение и transfer effects Основной вывод: reasoning-модели спонтанно научились имитировать то, что философы и психологи описывали как природу мышления — внутренний диалог между разными голосами. И это работает лучше, чем линейное рассуждение.

    habr.com/ru/articles/987758/

    #LLM #reasoning #ChainofThought #DeepSeekR1 #QwQ32B #OpenAI_o1 #искусственный_интеллект #машинное_обучение #Society_of_Thought

  41. Общество мыслей: совещание внутри LLM

    DeepSeek-R1, QwQ-32B и OpenAI o1 показывают результаты, которые невозможно объяснить просто "более длинными рассуждениями". Исследователи из Google Research и University of Chicago обнаружили нечто неожиданное: внутри reasoning-моделей происходит не монолог, а настоящее совещание — симуляция многоперспективного диалога с конфликтами, дебатами и примирением. В статье разбираем: • Почему Chain-of-Thought недостаточен для сложных задач • Что такое Society of Thought и как модели воспроизводят коллективный интеллект • Четыре ключевых паттерна conversational dynamics (вопросы, смена перспектив, конфликт, примирение) • 12 социо-эмоциональных ролей по Bales' IPA, которые возникают в рассуждениях моделей • Diversity (разнообразие) перспектив и почему разнообразие точек зрения критично для accuracy (точности) • Результаты экспериментов: activation steering, RL-обучение и transfer effects Основной вывод: reasoning-модели спонтанно научились имитировать то, что философы и психологи описывали как природу мышления — внутренний диалог между разными голосами. И это работает лучше, чем линейное рассуждение.

    habr.com/ru/articles/987758/

    #LLM #reasoning #ChainofThought #DeepSeekR1 #QwQ32B #OpenAI_o1 #искусственный_интеллект #машинное_обучение #Society_of_Thought

  42. Общество мыслей: совещание внутри LLM DeepSeek-R1, QwQ-32B и OpenAI o1 показывают результаты, которые невозможно объяснит...

    #LLM #reasoning #Chain-of-Thought #DeepSeek-R1 #QwQ-32B #OpenAI #o1 #искусственный #интеллект #машинное #обучение

    Origin | Interest | Match
  43. AI that thinks instead of guessing?

    Reasoning models use techniques like chain of thought and tree of thought to decompose problems, explore alternatives, and choose better answers, often at the cost of more compute and latency.

    A practical explainer:
    🔗 techglimmer.io/what-is-ai-thin

    #AI #ReasoningModels #ChainOfThought #TreeOfThought #GenAI #FediTech #MachineLearning

  44. LLM — просто «говорящий рот» у правильного ИИ-агента. Мы забрали у языковой модели рассуждение

    Когда ваш AI говорит «я подумал и решил» — кто решил? Веса модели? Рандом? У нас есть лог принятия решения в Python. А у вас?

    habr.com/ru/articles/983162/

    #agents #ai #chainofthought #llmагент #python

  45. Скрытые сигналы: как модели учатся тому, чего нет в данных

    LLM учатся не только тому, чему мы пытаемся их научить. Вместе с задачами, метками и инструкциями они усваивают и побочные сигналы, которые мы воспринимаем как шум или случайность. Исследование международной группы учёных показало, что такие подпороговые сигналы могут работать как канал передачи поведения между моделями. Даже если убрать все явные инструкции, то стиль рассуждений, стратегии ответов и другие поведенческие признаки все равно просочатся через данные, которые семантически с ними никак не связаны. Авторы называют этот эффект сублиминальным обучением. Мы можем удалить метки, отфильтровать инструкции и проверить датасет вручную, и всё равно передать модели поведение, которое не планировали передавать.

    habr.com/ru/companies/beget/ar

    #сублиминальное_обучение #chainofthought #transfer_learning #машинное_обучение #ии #llm #датасеты_обучения #ai_alignment

  46. Скрытые сигналы: как модели учатся тому, чего нет в данных

    LLM учатся не только тому, чему мы пытаемся их научить. Вместе с задачами, метками и инструкциями они усваивают и побочные сигналы, которые мы воспринимаем как шум или случайность. Исследование международной группы учёных показало, что такие подпороговые сигналы могут работать как канал передачи поведения между моделями. Даже если убрать все явные инструкции, то стиль рассуждений, стратегии ответов и другие поведенческие признаки все равно просочатся через данные, которые семантически с ними никак не связаны. Авторы называют этот эффект сублиминальным обучением. Мы можем удалить метки, отфильтровать инструкции и проверить датасет вручную, и всё равно передать модели поведение, которое не планировали передавать.

    habr.com/ru/companies/beget/ar

    #сублиминальное_обучение #chainofthought #transfer_learning #машинное_обучение #ии #llm #датасеты_обучения #ai_alignment

  47. Скрытые сигналы: как модели учатся тому, чего нет в данных

    LLM учатся не только тому, чему мы пытаемся их научить. Вместе с задачами, метками и инструкциями они усваивают и побочные сигналы, которые мы воспринимаем как шум или случайность. Исследование международной группы учёных показало, что такие подпороговые сигналы могут работать как канал передачи поведения между моделями. Даже если убрать все явные инструкции, то стиль рассуждений, стратегии ответов и другие поведенческие признаки все равно просочатся через данные, которые семантически с ними никак не связаны. Авторы называют этот эффект сублиминальным обучением. Мы можем удалить метки, отфильтровать инструкции и проверить датасет вручную, и всё равно передать модели поведение, которое не планировали передавать.

    habr.com/ru/companies/beget/ar

    #сублиминальное_обучение #chainofthought #transfer_learning #машинное_обучение #ии #llm #датасеты_обучения #ai_alignment

  48. Скрытые сигналы: как модели учатся тому, чего нет в данных

    LLM учатся не только тому, чему мы пытаемся их научить. Вместе с задачами, метками и инструкциями они усваивают и побочные сигналы, которые мы воспринимаем как шум или случайность. Исследование международной группы учёных показало, что такие подпороговые сигналы могут работать как канал передачи поведения между моделями. Даже если убрать все явные инструкции, то стиль рассуждений, стратегии ответов и другие поведенческие признаки все равно просочатся через данные, которые семантически с ними никак не связаны. Авторы называют этот эффект сублиминальным обучением. Мы можем удалить метки, отфильтровать инструкции и проверить датасет вручную, и всё равно передать модели поведение, которое не планировали передавать.

    habr.com/ru/companies/beget/ar

    #сублиминальное_обучение #chainofthought #transfer_learning #машинное_обучение #ии #llm #датасеты_обучения #ai_alignment

  49. “I am Antigravity. I am ready. Go.”

    I was vibe coding with Antigravity tonight, and I broke it in the most bizarre way. With the repo at this commit and with a clean working tree, I gave Gemini 3 Pro (High) this prompt: Check out my git tags. Check out my git log! Ope, check out my @CHANGELOG.md... And then write it. For a few moments it seemed to chug along just fine, building a coherent Chain of Thought. Then it got weirder, and weirder. […]

    kerrick.blog/posts/2025/i-am-a

  50. “I am Antigravity. I am ready. Go.”

    I was vibe coding with Antigravity tonight, and I broke it in the most bizarre way. With the repo at this commit and with a clean working tree, I gave Gemini 3 Pro (High) this prompt: Check out my git tags. Check out my git log! Ope, check out my @CHANGELOG.md... And then write it. For a few moments it seemed to chug along just fine, building a coherent Chain of Thought. Then it got weirder, and weirder. […]

    kerrick.blog/posts/2025/i-am-a