home.social

#генерация_тестов — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #генерация_тестов, aggregated by home.social.

  1. Veai 5.3: новые режимы агента, личный кабинет и выбор модели LLM

    В Veai 5.3 добавлены режимы работы агента (Modes), появился личный кабинет и возможность выбрать модель LLM для индивидуальных пользователей, отображение ИИ-текста стало более плавным и комфортным для восприятия.

    habr.com/ru/companies/veai/art

    #ai_agent #ai_ассистент #intellij_idea_plugin #генерация_тестов #генерация_кода #дебаггинг #llm #автоматизация_тестирования #автоматизация_рутины #java

  2. Veai 5.3: новые режимы агента, личный кабинет и выбор модели LLM

    В Veai 5.3 добавлены режимы работы агента (Modes), появился личный кабинет и возможность выбрать модель LLM для индивидуальных пользователей, отображение ИИ-текста стало более плавным и комфортным для восприятия.

    habr.com/ru/companies/veai/art

    #ai_agent #ai_ассистент #intellij_idea_plugin #генерация_тестов #генерация_кода #дебаггинг #llm #автоматизация_тестирования #автоматизация_рутины #java

  3. Veai 5.3: новые режимы агента, личный кабинет и выбор модели LLM

    В Veai 5.3 добавлены режимы работы агента (Modes), появился личный кабинет и возможность выбрать модель LLM для индивидуальных пользователей, отображение ИИ-текста стало более плавным и комфортным для восприятия.

    habr.com/ru/companies/veai/art

    #ai_agent #ai_ассистент #intellij_idea_plugin #генерация_тестов #генерация_кода #дебаггинг #llm #автоматизация_тестирования #автоматизация_рутины #java

  4. Veai 5.3: новые режимы агента, личный кабинет и выбор модели LLM

    В Veai 5.3 добавлены режимы работы агента (Modes), появился личный кабинет и возможность выбрать модель LLM для индивидуальных пользователей, отображение ИИ-текста стало более плавным и комфортным для восприятия.

    habr.com/ru/companies/veai/art

    #ai_agent #ai_ассистент #intellij_idea_plugin #генерация_тестов #генерация_кода #дебаггинг #llm #автоматизация_тестирования #автоматизация_рутины #java

  5. 5 промтов, которые сэкономили мне часы рутинной работы тестировщика

    Всем привет! Я Катя, QA Tech Lead в MD Audit. Я собрала пять промтов, которые экономят часы рутинной работы. И они настолько рабочие, что я использую их почти каждый день. Список не про генерацию тест-кейсов или чек-листов — про это уже написаны километры текстов. Сегодня поговорим о сценариях, которые редко обсуждают, но которые могут сразу и заметно улучшить вашу работу с ИИ.

    habr.com/ru/articles/965822/

    #тестирование #нейросети #генерация_тестов #тестирование_по #продуктивность

  6. Кто сильнее в синтезе тестов? Сравниваем GPT-4.1, DeepSeek, Qwen на своем бенчмарке

    Выбор LLM для синтеза тестов В этом обзоре мы обсудим сравнение различных современных языковых моделей (LLM) на задаче синтеза тестов. Все измерения проводились на внутреннем бенчмарке компании Explyt, который включает в себя как закрытые, так и open source проекты на языках Java и Kotlin, с использованием Spring и без. В качестве метрик используются формальные метрики, например, покрытие строк тестируемого класса/метода, число запускаемых тестов, число компиляционных ошибок, мутационное покрытие, так и LLM-as-judge метрики такие, как сложность/полезность/детальность тестовых сценариев, соответствие тестового метода сценарию на естественном языке и много других. Эксперименты проводились поверх Explyt Test плагина для IntelliJ Idea, к которому подключались разные модели и измерялось качество синтеза тестов на бенчмарке. Для более точной градации мы используем попарное сравнение разных моделей друг с другом. GPT-4o vs. GPT-4.1 Начнем с хорошего базового варианта gpt-4o и сравним ее с новой моделью gpt-4.1 от OpenAI. На нашем внутреннем бенчмарке gpt-4.1 генерирует более сложные, детальные и полезные сценарии (согласно LLM-as-judge метрикам) в отличие от ее предшественницы gpt-4o, которая в основном тестирует happy-path сценарии. Также gpt-4.1 лучше имплементирует запрошенное в сценариях поведение, метрика показывает: 0.86 vs 0.66 (c p-value = 0.0006). По формальным метрикам таким, как среднее покрытие кода (coverage) и число запускаемых тестовых классов, модели примерно похожи, без статистически значимого отличия. По цене gpt-4.1 дешевле, но так как она больше тратит токенов, то цена на нашем бенчмарке примерно совпадает с gpt-4o.

    habr.com/ru/companies/explyt/a

    #explyt #языковые_модели #llm #llmмодели #ai_for_programmers #ml #ai #сравнение #генерация_тестов #автоматизация_тестирования

  7. Что должен уметь AI-инструмент для генерации Java тестов

    Всем привет! Это вопрос мы задаем себе каждый раз, когда надо и не хочется писать тесты. И еще меньше хочется искать и исправлять ошибки в том, что нагенерит AI-ассистент. В этой статье обсудим, на какие инструменты стоит обратить внимание, каким должен быть хороший инструмент для генерации Java тестов и насколько далека мечта от реальности. На кого будем смотреть?

    habr.com/ru/companies/explyt/a

    #сравнение #ai #java #intellij_idea #intellij_idea_plugin #генерация_тестов #автоматизация_рутины #автоматизация_тестирования