home.social

#чатбот_llm — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #чатбот_llm, aggregated by home.social.

  1. Как сделать ИИ-агентов и RAG действительно автономными

    Существует проблема описанная тут (ссылка на пост в ТГ). Суть проста — если LLM (или агенты вокруг LLM) вызывают последовательно одни и те же запросы с одним и тем же контекстом, попадание в тупик/цикл — вопрос лишь времени. То есть в случае зацикливания между агентами/контекстами надо менять промты или контекст, или последовательность вызова агентов. Это яркая демонстрация когда агенты не смотря на всю свою сложность тупят хуже моей кошки. Кошка не будет в цикле проверять две пустые миски в поисках еды, она сделает это раз, ну или два и пойдет дальше. А агенты будут если наткнутся на такую ситуацию.

    habr.com/ru/articles/931836/

    #ииассистент #ииагенты #ииагент #ииагенты_для_разработки #rag #чатбот #чатботы #чатбот_python #чатбот_llm #llmагент

  2. Как сделать ИИ-агентов и RAG действительно автономными

    Существует проблема описанная тут (ссылка на пост в ТГ). Суть проста — если LLM (или агенты вокруг LLM) вызывают последовательно одни и те же запросы с одним и тем же контекстом, попадание в тупик/цикл — вопрос лишь времени. То есть в случае зацикливания между агентами/контекстами надо менять промты или контекст, или последовательность вызова агентов. Это яркая демонстрация когда агенты не смотря на всю свою сложность тупят хуже моей кошки. Кошка не будет в цикле проверять две пустые миски в поисках еды, она сделает это раз, ну или два и пойдет дальше. А агенты будут если наткнутся на такую ситуацию.

    habr.com/ru/articles/931836/

    #ииассистент #ииагенты #ииагент #ииагенты_для_разработки #rag #чатбот #чатботы #чатбот_python #чатбот_llm #llmагент

  3. Как сделать ИИ-агентов и RAG действительно автономными

    Существует проблема описанная тут (ссылка на пост в ТГ). Суть проста — если LLM (или агенты вокруг LLM) вызывают последовательно одни и те же запросы с одним и тем же контекстом, попадание в тупик/цикл — вопрос лишь времени. То есть в случае зацикливания между агентами/контекстами надо менять промты или контекст, или последовательность вызова агентов. Это яркая демонстрация когда агенты не смотря на всю свою сложность тупят хуже моей кошки. Кошка не будет в цикле проверять две пустые миски в поисках еды, она сделает это раз, ну или два и пойдет дальше. А агенты будут если наткнутся на такую ситуацию.

    habr.com/ru/articles/931836/

    #ииассистент #ииагенты #ииагент #ииагенты_для_разработки #rag #чатбот #чатботы #чатбот_python #чатбот_llm #llmагент

  4. Как сделать ИИ-агентов и RAG действительно автономными

    Существует проблема описанная тут (ссылка на пост в ТГ). Суть проста — если LLM (или агенты вокруг LLM) вызывают последовательно одни и те же запросы с одним и тем же контекстом, попадание в тупик/цикл — вопрос лишь времени. То есть в случае зацикливания между агентами/контекстами надо менять промты или контекст, или последовательность вызова агентов. Это яркая демонстрация когда агенты не смотря на всю свою сложность тупят хуже моей кошки. Кошка не будет в цикле проверять две пустые миски в поисках еды, она сделает это раз, ну или два и пойдет дальше. А агенты будут если наткнутся на такую ситуацию.

    habr.com/ru/articles/931836/

    #ииассистент #ииагенты #ииагент #ииагенты_для_разработки #rag #чатбот #чатботы #чатбот_python #чатбот_llm #llmагент

  5. [Перевод] Оценка чат-ботов LLM: основные метрики и методы тестирования

    В этой статье я научу вас, как оценивать LLM-чат-ботов, чтобы понять, достаточно ли они убедительны, чтобы сойти за реальных людей. Но что еще важнее, вы сможете использовать результаты этой оценки, чтобы понять, как улучшить своего LLM-чат-бота, например, изменив промпт или саму LLM-модель. В этой статье вы узнаете: * Разницу между оценкой LLM-чат-ботов и стандартной оценкой LLM * Различные подходы к оценке LLM-диалогов * Различные типы метрик для оценки LLM-чат-ботов * Как реализовать оценку LLM-диалогов в коде с использованием DeepEval

    habr.com/ru/articles/876584/

    #llm #чатбот_LLM #DeepEval #Confident_AI