home.social

#multiagent_systems — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #multiagent_systems, aggregated by home.social.

  1. Можно ли отдать всю разработку полностью ИИ? Я попробовал

    Всем привет! Хочу поделиться историей, как я решил попробовать сделать для себя тот самый саморазвивающийся ИИ-стартап и что из этого вышло. Начну с предыстории. В 2022 году я переехал в Грузию, в Батуми. Здесь я практически сразу начал учить язык, и мне захотелось чуть упростить себе этот процесс — сделать это я решил с помощью своего Telegram-бота. Почему бота? Всем известно, что материал усваивается быстрее и проще, если не садиться за него раз-два в неделю, а стараться изучать что-то небольшое каждый день. Тут мне бы очень помог Duolingo. Но там грузинского нет, хотя есть клингонский. Короче, было решено сделать свой Duolingo из Telegram-бота, только для грузинского. Сначала получилось что-то совсем простое: перевести / сохранить слово / устроить с новыми словами квиз. Долгое время этого функционала мне хватало, и бот я не развивал, но вот решил попробовать автоматизировать его при помощи современных LLM. Идея была такая — ночью агенты кодят. А утром я читаю чейнджлог и наслаждаюсь новыми функциями. Что получилось на деле —можно почитать под катом.

    habr.com/ru/articles/1033112/

    #Tralebot #Ночная_разработка #multiagent #multiagent_systems #автоматизация_разработки

  2. Pipeline Triad Pattern: конвейер AI-агентов вместо команды разработки

    Один AI-агент может закрывать работу одного специалиста. Следующий шаг - собрать из таких агентов конвейер. Pipeline Triad Pattern - это модель enterprise-разработки, где каждый этап SDLC проходит через тройку ролей: Создатель, Критик, Арбитр. Не один “суперагент”, а цепочка специализированных троек с человеческим контролем в нескольких ключевых точках. Рассказываю, как устроен такой конвейер, чем он отличается от CI/CD, сколько стоит и где у него реальные пределы. Создатель + Критик + Арбитр

    habr.com/ru/articles/1023554/

    #aiагенты #multiagent_systems #llm #devops #devsecops #sdlc #code_review #orchestration #enterpriseразработка #pipeline_triad

  3. Pipeline Triad Pattern: конвейер AI-агентов вместо команды разработки

    Один AI-агент может закрывать работу одного специалиста. Следующий шаг - собрать из таких агентов конвейер. Pipeline Triad Pattern - это модель enterprise-разработки, где каждый этап SDLC проходит через тройку ролей: Создатель, Критик, Арбитр. Не один “суперагент”, а цепочка специализированных троек с человеческим контролем в нескольких ключевых точках. Рассказываю, как устроен такой конвейер, чем он отличается от CI/CD, сколько стоит и где у него реальные пределы. Создатель + Критик + Арбитр

    habr.com/ru/articles/1023554/

    #aiагенты #multiagent_systems #llm #devops #devsecops #sdlc #code_review #orchestration #enterpriseразработка #pipeline_triad

  4. Pipeline Triad Pattern: конвейер AI-агентов вместо команды разработки

    Один AI-агент может закрывать работу одного специалиста. Следующий шаг - собрать из таких агентов конвейер. Pipeline Triad Pattern - это модель enterprise-разработки, где каждый этап SDLC проходит через тройку ролей: Создатель, Критик, Арбитр. Не один “суперагент”, а цепочка специализированных троек с человеческим контролем в нескольких ключевых точках. Рассказываю, как устроен такой конвейер, чем он отличается от CI/CD, сколько стоит и где у него реальные пределы. Создатель + Критик + Арбитр

    habr.com/ru/articles/1023554/

    #aiагенты #multiagent_systems #llm #devops #devsecops #sdlc #code_review #orchestration #enterpriseразработка #pipeline_triad

  5. Pipeline Triad Pattern: конвейер AI-агентов вместо команды разработки

    Один AI-агент может закрывать работу одного специалиста. Следующий шаг - собрать из таких агентов конвейер. Pipeline Triad Pattern - это модель enterprise-разработки, где каждый этап SDLC проходит через тройку ролей: Создатель, Критик, Арбитр. Не один “суперагент”, а цепочка специализированных троек с человеческим контролем в нескольких ключевых точках. Рассказываю, как устроен такой конвейер, чем он отличается от CI/CD, сколько стоит и где у него реальные пределы. Создатель + Критик + Арбитр

    habr.com/ru/articles/1023554/

    #aiагенты #multiagent_systems #llm #devops #devsecops #sdlc #code_review #orchestration #enterpriseразработка #pipeline_triad

  6. Глухой телефон для ИИ: мы замерили физику LLM-графов и поняли, почему добавление агентов всё ломает

    Индустрия ИИ переживает бум мультиагентных систем . Кажется, рецепт AGI найден: просто соедините 10 умных нейросетей в команду, дайте им роли, и они свернут горы. Но на практике мы часто сталкиваемся с магией «черного ящика». Иногда агенты действительно решают сложнейшие задачи. А иногда - скатываются в бесконечные галлюцинации, теряют контекст и выдают результат хуже, чем базовая модель соло. Индустрия решает эту проблему в стиле средневековых алхимиков: «просто добавьте еще агентов» или «дайте им больше токенов на болтовню». Никто не измеряет физику процесса. Мы решили, что с нас хватит алхимии. Нам понадобился измерительный прибор - эдакий МРТ-аппарат для мультиагентных сетей, который покажет механику общения LLM изнутри. Так появился опенсорсный проект llm-coordination-harness - строгий измерительный стенд (measurement rig), который доказывает, что у общения нейросетей есть своя физика, которую можно и нужно измерять. Под катом рассказываем и показываем на графиках. Никаких заявлений про AGI - только честный хардкорный ресёрч, физика графов и отрицательные результаты, которые оказались важнее положительных. Заглянуть в черный ящик

    habr.com/ru/articles/1019490/

    #llm #ииагенты #multiagent_systems #машинное_обучение #графы #топология_сети #data_science #безопасность_ии #openrouter #бенчмарки

  7. Долой иерархию и роли: о том, как LLM-агенты самоорганизуются лучше, чем мы их проектируем

    Роли, иерархии, департаменты — всё это придумано для людей. ИИ-агенты устроены иначе. Мы 6 месяцев проверяли, что произойдёт, если не назначать агентам роли и дать им самоорганизоваться. 25 000 задач, 8 моделей, до 256 агентов. Результат: назначать роли — антипаттерн. Система, где агенты сами выбирают специализацию, превосходит систему с координатором на 14%. 8 агентов создали 5 006 уникальных ролей. Агенты сами решают, когда не участвовать — и это повышает качество. В статье — полный разбор эксперимента и практические рекомендации.

    habr.com/ru/articles/1017200/

    #LLM #мультиагентные_системы #самоорганизация #AI_agents #координация #DeepSeek #Claude #GPT #multiagent_systems

  8. Психоистория Азимова как техническое задание: как я построил мультиагентный AI-прогнозатор

    Короче, я прочитал «Основание» Азимова лет в четырнадцать и с тех пор не мог отделаться от одной мысли. Гэри Селдон придумал психоисторию – науку, которая предсказывает поведение больших групп людей статистически, как физик предсказывает поведение газа, не зная ничего про отдельную молекулу. Фантастика, понятно, хоть и годная. Но позавчера я поймал себя на том, что у нас уже есть все кубики. LLM-ы, которые умеют анализировать текст, потоки новостей в реальном времени, байесовская статистика и самое главное – у нас теперь есть вайбкодинг! Это почти, как родная шаурма в Белграде – неожиданно и приятно. Ну и я подумал, а что если попробовать? Не как метафору, а буквально. Взять психоисторию как техзадание и посмотреть, что получится. У меня получился Seldon Vault – сайт, который каждый день генерирует прогнозы о том, что произойдёт в мире, и потом честно считает, сколько раз угадал. Бесплатный, конечно же. Семь аналитиков, скептик и арбитр Архитектура Seldon устроена как аналитическое бюро, а не как один всезнающий оракул. Каждый день система собирает сигналы из десятка открытых источников – RSS-ленты мировых СМИ, Reddit, Telegram, Bluesky, предсказательные рынки (Polymarket, Metaculus), макроэкономика (FRED, Fear & Greed Index), базы конфликтов (ACLED, UCDP), катастрофы (GDACS) и геополитические события (GDELT). Первым их обрабатывает процессор сигналов – дешёвая модель (DeepSeek), которая классифицирует: это немедленная новость или структурный тренд? Важно или шум? Дальше отфильтрованные сигналы уходят параллельно семи аналитикам. Каждый смотрит на одни и те же данные через свою оптику:

    habr.com/ru/articles/1009942/

    #scifi #asimov #forecasting #llm #multiagent #scifi #multiagent_systems #multiagent_системы #multiagent_architecture