#veai — Public Fediverse posts
Live and recent posts from across the Fediverse tagged #veai, aggregated by home.social.
-
Как мы написали UI-тесты для ИИ-агента внутри JetBrains IDE
Как проверить, что ИИ-агент в IDE работает, если на одинаковые запросы LLM отвечает по-разному? Ответы модели недетерминированы, а интерфейс и бизнес-логика вполне детерминированы, и их нужно тестировать отдельно. Мы делаем ИИ-агента, встраиваемого в JetBrains IDE. В статье расскажу, как мы выстроили UI-автоматизацию плагина так, чтобы тесты ловили регрессии в интерфейсе, бизнес-логике и при этом не «моргали» из-за нестабильности LLM. Тааак, падажжи
https://habr.com/ru/companies/veai/articles/1028756/
#veai #тестирование #ide #intellij_idea_plugin #плагин_ide #quality_gates #kotlin #intellij_platform #aiagent #ииагент
-
GLM 5.1 vs. DeepSeek V3.2: сравниваем топовые китайские модели
В Veai мы регулярно тестируем и сравниваем модели, которые доступны у нас в плагине. Каждая модель, которую мы добавляем проходит через наш собственный бенчмарк, прежде чем попасть в продакшн. Недавно тестированию подверглись GLM 5.1 и DeepSeek V3.2. Делимся результатами.
https://habr.com/ru/companies/veai/articles/1027370/
#агент_для_разработчиков #AIагент #бенчмарк_LLM #GLM_51 #DeepSeek_V32 #сравнение_моделей #кодингагент #Veai #open_source_LLM #LLMсудьи
-
Вайбдебаггинг — уже реальность? Мы дали ИИ-агенту отладчик и проверили
В конце прошлого года Cursor выпустил Debug Mode — режим, в котором агент может собирать логи из рантайма, чтобы лучше понимать причины багов. Судя по реакции на Reddit , идею приняли с интересом. Но что, если пойти более прямым путём? Дать агенту «руки», чтобы он отлаживался так же, как это делает разработчик: ставил брейкпоинты, ходил по ним, выполнял evaluate expression? Этим вопросом недавно задались исследователи из Microsoft Research и сделали экспериментальный фреймворк Debug2Fix . Субагент, оснащённый инструментами для взаимодействия с отладчиком, разбирался с багами из датасетов GitBug-Java и SWE-Bench-Live на 20% лучше, чем обычный агент без таких инструментов. Если агент уже интегрирован с IDE, естественно дать ему доступ к полноценному дебаггеру, когда он так близко. Тем более что этим занимаются даже в Microsoft. Поэтому в недавнем релизе своего ассистента для IntelliJ мы добавили Debug Agent, позволяющий агенту взаимодействовать с дебаггером в среде разработки. Сегодня попробуем починить реальный баг с помощью агента с инструментами дебаггера в IDE и Cursor в Debug Mode и проверим, действительно ли ИИ нужен полный доступ к отладчику или достаточно и хорошего логгирования.
https://habr.com/ru/companies/veai/articles/1024264/
#отладка #ииагенты #cursor #veai #debug #intellij #искусственный_интеллект #дебаггер #ииассистент #вайбкодинг
-
На стыке AI и науки: Летняя школа Veai для студентов
День студента — отличный повод поговорить не только о сессиях и вечеринках, но и о том, зачем вообще учиться. Новые идеи и технологии, нестандартные решения появляются там, где есть пространство для эксперимента, глубокого исследования и диалога между академической средой и индустрией. Образовательные проекты совместно с ведущими ВУЗами Росиии, ИТМО и СПбГУ – важная часть нашей работы. Летняя школа Проекты и отзывы
https://habr.com/ru/companies/veai/articles/988328/
#стажировка_в_it #студенты #студенческие_проекты #практика #искусственный_интеллект #машинное_обучение #программирование #ai_agent #ai_for_programmers #veai