home.social

#veai — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #veai, aggregated by home.social.

  1. Как мы написали UI-тесты для ИИ-агента внутри JetBrains IDE

    Как проверить, что ИИ-агент в IDE работает, если на одинаковые запросы LLM отвечает по-разному? Ответы модели недетерминированы, а интерфейс и бизнес-логика вполне детерминированы, и их нужно тестировать отдельно. Мы делаем ИИ-агента, встраиваемого в JetBrains IDE. В статье расскажу, как мы выстроили UI-автоматизацию плагина так, чтобы тесты ловили регрессии в интерфейсе, бизнес-логике и при этом не «моргали» из-за нестабильности LLM. Тааак, падажжи

    habr.com/ru/companies/veai/art

    #veai #тестирование #ide #intellij_idea_plugin #плагин_ide #quality_gates #kotlin #intellij_platform #aiagent #ииагент

  2. GLM 5.1 vs. DeepSeek V3.2: сравниваем топовые китайские модели

    В Veai мы регулярно тестируем и сравниваем модели, которые доступны у нас в плагине. Каждая модель, которую мы добавляем проходит через наш собственный бенчмарк, прежде чем попасть в продакшн. Недавно тестированию подверглись GLM 5.1 и DeepSeek V3.2. Делимся результатами.

    habr.com/ru/companies/veai/art

    #агент_для_разработчиков #AIагент #бенчмарк_LLM #GLM_51 #DeepSeek_V32 #сравнение_моделей #кодингагент #Veai #open_source_LLM #LLMсудьи

  3. Вайбдебаггинг — уже реальность? Мы дали ИИ-агенту отладчик и проверили

    В конце прошлого года Cursor выпустил Debug Mode — режим, в котором агент может собирать логи из рантайма, чтобы лучше понимать причины багов. Судя по реакции на Reddit , идею приняли с интересом. Но что, если пойти более прямым путём? Дать агенту «руки», чтобы он отлаживался так же, как это делает разработчик: ставил брейкпоинты, ходил по ним, выполнял evaluate expression? Этим вопросом недавно задались исследователи из Microsoft Research и сделали экспериментальный фреймворк Debug2Fix . Субагент, оснащённый инструментами для взаимодействия с отладчиком, разбирался с багами из датасетов GitBug-Java и SWE-Bench-Live на 20% лучше, чем обычный агент без таких инструментов. Если агент уже интегрирован с IDE, естественно дать ему доступ к полноценному дебаггеру, когда он так близко. Тем более что этим занимаются даже в Microsoft. Поэтому в недавнем релизе своего ассистента для IntelliJ мы добавили Debug Agent, позволяющий агенту взаимодействовать с дебаггером в среде разработки. Сегодня попробуем починить реальный баг с помощью агента с инструментами дебаггера в IDE и Cursor в Debug Mode и проверим, действительно ли ИИ нужен полный доступ к отладчику или достаточно и хорошего логгирования.

    habr.com/ru/companies/veai/art

    #отладка #ииагенты #cursor #veai #debug #intellij #искусственный_интеллект #дебаггер #ииассистент #вайбкодинг

  4. На стыке AI и науки: Летняя школа Veai для студентов

    День студента — отличный повод поговорить не только о сессиях и вечеринках, но и о том, зачем вообще учиться. Новые идеи и технологии, нестандартные решения появляются там, где есть пространство для эксперимента, глубокого исследования и диалога между академической средой и индустрией. Образовательные проекты совместно с ведущими ВУЗами Росиии, ИТМО и СПбГУ – важная часть нашей работы. Летняя школа Проекты и отзывы

    habr.com/ru/companies/veai/art

    #стажировка_в_it #студенты #студенческие_проекты #практика #искусственный_интеллект #машинное_обучение #программирование #ai_agent #ai_for_programmers #veai