home.social

#большая_языковая_модель — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #большая_языковая_модель, aggregated by home.social.

  1. «Господин Говорунъ: как я обучил маленькую модель разговаривать на дореформенном русском»

    Я обучил небольшую языковую модель, которая отвечает на дореформенном русском как человек из XIX века. Рассказываю, как подготовил данные, собрал синтетический корпус, обучил tiny-LLM и опубликовал её в виде чат-бота. Читать далѣе

    habr.com/ru/articles/971266/

    #большая_языковая_модель #искусственный_интеллект #история #обучение_модели #синтетические_данные #finetuning #huggingface

  2. MAESTRO — новый фреймворк для построения мультиагентных систем и цифровых ассистентов на основе LLM

    Привет, Хабр! За последний год стало ясно, что использование нескольких LLM в агентном режиме приносит существенно больше пользы, чем простая сумма их компьюта по отдельности. Гибкость, распределение ролей и активное взаимодействие моделей позволяет достичь значительных успехов в самых различных задачах, включая создание полезных цифровых ассистентов. Построением таких систем заняты многие команды по всему миру. Чтобы ускорить прогресс в этом направлении и помочь коллегам, мы в группе «Мультимодальные архитектуры ИИ» AIRI создали новый фреймворк под названием MAESTRO — Multi‑Agent Ecosystem of Task Reasoning and Orchestration. Мы представили его на конференции AI Journey 2025, которая прошла в Москве на прошлой неделе. В этой статье нам бы хотелось поподробнее рассказать о нашей разработке, описать устройство фреймворка и дать примеры его использования.

    habr.com/ru/companies/airi/art

    #мультиагентность #мультиагентные_системы #агент #оркестрация #ассистент #помощник #большая_языковая_модель #взаимодействие_агентов #цепочки_рассуждений #reasoning

  3. Как я устал тестировать LLM-системы вручную и написал универсальный сканер уязвимостей

    Полгода назад я работал над внедрением RAG-системы в крупной финансовой компании. Задача была типичная: построить корпоративного чат-бота, который мог бы отвечать на вопросы сотрудников по внутренним документам. Казалось бы, что может пойти не так? Берем готовую LLM, подключаем к базе знаний, добавляем немного магии с векторным поиском — и готово. Но когда я начал тестировать систему перед продакшеном, обнаружил, что наш "умный" ассистент превращается в болтливого предателя при правильно сформулированных вопросах.

    habr.com/ru/articles/929168/

    #devsecops #машинное_обучение #rag #информационная_безопасность #искуственный_интеллект #devops #python #llm #большая_языковая_модель

  4. Джейлбрейкаем чатботы: ChatGPT без фильтров

    Привет!
    Сегодня мы копнём в одну из самых спорных и недооценённых тем в мире ИИ — джейлбрейки чатботов. То самое, что позволяет убрать встроенные тормоза и меньше читать “I'm sorry, I cannot help with that” и заставить чатбот говорить с вами как с взрослым человеком, а не как корпоративный душнила.

    habr.com/ru/articles/923084/

    #ии #ииассистент #ии_чатбот #большая_языковая_модель #чатбот #чат #безопасность #безопасная_разработка #этика #этичный_хакер

  5. Языковые модели против мошенников: как LLM помогают бороться с отмыванием денег и финансовым мошенничеством

    С ростом цифровизации банковских услуг злоумышленники становятся всё изощрённее: от схем отмывания денег через фиктивные юрлица — до автоматизированных атак через фишинг, подмену номеров, скимминг и социальная инженерия. Бизнес теряет миллиарды, клиенты — доверие. В этих условиях защитные технологии — уже не просто брандмауэр, а целый арсенал аналитических систем. В статье рассмотрим, как LLM может помочь финансовым организациям для противодействия мошенничеству и отмыванию денежных средств.

    habr.com/ru/articles/908424/

    #финансовое_мошенничество #антифрод #AF #AML #llm #большая_языковая_модель

  6. Как обучить LLM выбирать правильные варианты кода, сгенерированные другой моделью. Разбор от Тайного редактора

    «Тайный редактор» будет на регулярной основе коротко разжевывать суть научных публикаций по технологиям искусственного интеллекта, отвечать на неудобные вопросы по ИИ, объяснять события, развеивать мифы и разоблачать пустой хайп вокруг технологий. Сегодня разбираем статью от исследователей MTS AI Iterative Self-Training for Code Generation via Reinforced Re-Ranking - о том, как можно обучить реранжирующую модель выбирать качественные варианты кода, сгенерированные другой моделью. Спойлер: с этим подходом удается сделать так, что модель на 13B параметров может обогнать по качеству 33B.

    habr.com/ru/companies/mts_ai/a

    #искусственный_интеллект #модель #большая_языковая_модель #генерация_кода #оценка_моделей

  7. Робот-бариста: выполнение сложных задач в сложной среде

    Многие действия, которые мы выполняем в повседневной жизни, кажутся нам весьма тривиальными. Однако для роботов они либо крайне сложны, либо вовсе невыполнимы. Конечно, это может быть связано с отсутствием тех или иных физических элементов (робот-манипулятор не имеет ног, а потому по лестнице не подымется), однако куда более интересно интеллектуальное ограничение. Насколько сложно приготовить чашку растворимого кофе на оживленной кухне? Человеку не нужно для этого быть Гордоном Рамзи, но вот для робота эта задача куда более сложна. Ученые из Эдинбургского университета (Шотландия) создали робота с встроенным ИИ, который способен выполнять сложные многошаговые задачи в непредсказуемых условиях, таких как оживленная офисная кухня. Какими особенностями обладает данный робот, и насколько он эффективно выполняет свои задачи? Ответы на эти вопросы мы найдем в докладе ученых.

    habr.com/ru/companies/ua-hosti

    #искусственный_интеллект #робототехника #роботманипулятор #кофе #сложные_задачи #интеллект #gpt #большая_языковая_модель

  8. Большой обзор больших языковых моделей

    LLM, или большая языковая модель, это нейронная сеть с крайне большим количеством изменяемых параметров, которая позволяет решать задачи по обработке и генерации текста. Чаще всего реализована в виде диалогового агента, с которым можно общаться в разговорной форме. Но это только определение, причём одно из. В статье — больше о понятиях LLM, из чего она состоит, а также возможность немного попрактиковаться.

    habr.com/ru/companies/gaz-is/a

    #llm #large_language_model #nlp #машинное_обучение #искусственный_интеллект #нейросети #большая_языковая_модель

  9. Пока не исправили — модифицируй, или Анализ расширений атаки уклонения для LLM

    Добрый день, уважаемые читатели Хабра. В связи с бурным развитием генеративных моделей и реализованных на них чат‑ботов ( ChatGPT , Gemini , Bard , Notion AI , Compose AI , Poe , Phind ) у пользователя появляется ложное чувство, что модели стали умнее, защищённее и, в целом, ближе к совершенству, сравнимы с человеческим интеллектом. Отсюда мы получаем целый пласт заблуждений. Например, что модели нас «чувствуют», «понимают», ведь мы выкладываем для них столько информации о себе, начиная от стилистики нашего письма, что уже является неким цифровым отпечатком нашей личности , и заканчивая оценкой их собственной работы. На самом деле это миф. И трендом 2023–2024 годов стало обширное внимание публики к XAI : - как они (генеративные модели) устроены и как они принимают решения; - как проводятся атаки уклонения (склонение моделей к неверной выдаче); - как эти атаки (уклонения) связаны с другими атаками на LLM и какие они могут быть для эскалации деструктивного поведения системы; - с какой позиции верно интерпретировать выход генеративной модели; - разработка системы эшелонированной защиты моделей; - разработка системы внутреннего критика для модели. Для начала начнём с существующих атак и их анализа. Заинтересованных приглашаем под кат.

    habr.com/ru/companies/sberbank

    #атака_уклонения #LLM #большая_языковая_модель

  10. OmniFusion 1.1: мультимодальность теперь и на русском

    В прошлом году на конференции AIJ 2023 мы представили первую версию OmniFusion — мультимодальной языковой модели (LLM), способной поддерживать визуальный диалог и отвечать на вопросы по картинкам. Спустя несколько месяцев мы готовы представить обновление — OmniFusion 1.1 — SoTA на ряде бенчмарков (среди моделей схожего размера) и, более того, модель хорошо справляется со сложными задачами и понимает русский язык! Самое главное — всё выкладываем в открытый доступ: веса и даже код обучения. Ниже расскажем об особенностях модели, процессе обучения и примерах использования. В первую очередь остановимся на архитектуре, а потом отдельно расскажем о проделанных экспериментах как в части архитектурных трюков, так и о работе с данными. Ну а несколько интересных кейсов на англ и русском языках можно посмотреть на палитре ниже.

    habr.com/ru/companies/airi/art

    #Мультимодальная_модель #omnifusion #визуальный_энкодер #адаптер #большая_языковая_модель

  11. Метод Binoculars обещает высокую точность обнаружения текста от больших языковых моделей

    ChatGPT пишет не хуже человека, но можно ли обнаружить «машинность» в тексте? Хотя некоторым компаниям было бы выгоднее представить всё так, будто результат работы языковых моделей неотличим от человеческого, исследования в этом направлении активно ведутся. Авторы научной статьи «Spotting LLMs With Binoculars: Zero-Shot Detection of Machine-Generated Text» ( arXiv:2401.12070 ) утверждают, что их метод имеет низкий уровень ложноположительных срабатываний (0,01 %), правильно обнаруживает текст от языковых моделей в 90 % случаев и работает для нескольких семейств современных продуктов.

    habr.com/ru/articles/789466/

    #LLM #БЯМ #large_language_model #большая_языковая_модель #large_language_models #большие_языковые_модели #OpenAI #Binoculars #ИИ #искусственный_интеллект #обнаружение_машинного_текста #антиспам #GPTZero #DetectGPT #Ghostbuster #ChatGPT #GPT3 #GPT4 #Falcon #Falcon7B #Falcon7Binstruct

  12. Метод Binoculars обещает высокую точность обнаружения текста от больших языковых моделей

    ChatGPT пишет не хуже человека, но можно ли обнаружить «машинность» в тексте? Хотя некоторым компаниям было бы выгоднее представить всё так, будто результат работы языковых моделей неотличим от человеческого, исследования в этом направлении активно ведутся. Авторы научной статьи «Spotting LLMs With Binoculars: Zero-Shot Detection of Machine-Generated Text» ( arXiv:2401.12070 ) утверждают, что их метод имеет низкий уровень ложноположительных срабатываний (0,01 %), правильно обнаруживает текст от языковых моделей в 90 % случаев и работает для нескольких семейств современных продуктов.

    habr.com/ru/articles/789466/

    #LLM #БЯМ #large_language_model #большая_языковая_модель #large_language_models #большие_языковые_модели #OpenAI #Binoculars #ИИ #искусственный_интеллект #обнаружение_машинного_текста #антиспам #GPTZero #DetectGPT #Ghostbuster #ChatGPT #GPT3 #GPT4 #Falcon #Falcon7B #Falcon7Binstruct