home.social

#llm_тестирование — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #llm_тестирование, aggregated by home.social.

  1. Тестирование LLM-приложений с DeepEval

    В этой статье я расскажу о способе написания тестов для LLM-приложений с использованием инструмента DeepEval. Рассмотрены базовые концепции данного инструмента, а также приведен пример его использования на реальном приложении c RAG. Будет теория и много примеров на Python. 🔥 Начинаем 🔥

    habr.com/ru/articles/984968/

    #llm #llmприложения #deepeval #исскуственный_интеллект #llm_тестирование

  2. Как ухватить LLM за хвост: эффективные стратегии тестирования AI-моделей

    Как убедиться, что ваша LLM не выдаст полную чепуху в самый неподходящий момент? Как проверить, что она действительно понимает контекст, а не просто генерирует красивые, но бессмысленные фразы? И самое главное — как сделать это эффективно, не тратя недели на ручную проверку тысяч ответов? Давайте разберёмся!

    habr.com/ru/articles/853038/

    #LLM_тестирование #LangSmith #GEval #DeepEval #AI_метрики #LLM