home.social

#langfuse — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #langfuse, aggregated by home.social.

  1. От RAG-прототипа к агенту в продакшн: путь по метрикам, а не по моде

    На связи Сергей Смирнов, AI-инженер LLMStart.ru. Сегодня расскажу о полноценном кейсе, который мы делали для компании Айтон: агенте-консультанте по 1С:УНФ, который помогает отвечать на вопросы клиентов по базе знаний, реальным диалогам поддержки и контексту конкретного обращения. Разберу всю хронологию, нюансы и путь от первой гипотезы до продакшена, которым уже пользуются клиенты. Для бизнеса этот кейс интересен как пример реальной автоматизации через ИИ: сначала ассистент для сотрудников, потом сервис для клиентов. Для технарей — подходом, где решение эволюционировало от RAG-прототипа к агенту на основании данных и метрик, а не потому, что «так модно».

    habr.com/ru/companies/llmstart

    #RAG #LLM #ИИагенты #LangChain #LangFuse #Ragas #метрики_качества #context_engineering #мультимодальность #ии

  2. От RAG-прототипа к агенту в продакшн: путь по метрикам, а не по моде

    На связи Сергей Смирнов, AI-инженер LLMStart.ru. Сегодня расскажу о полноценном кейсе, который мы делали для компании Айтон: агенте-консультанте по 1С:УНФ, который помогает отвечать на вопросы клиентов по базе знаний, реальным диалогам поддержки и контексту конкретного обращения. Разберу всю хронологию, нюансы и путь от первой гипотезы до продакшена, которым уже пользуются клиенты. Для бизнеса этот кейс интересен как пример реальной автоматизации через ИИ: сначала ассистент для сотрудников, потом сервис для клиентов. Для технарей — подходом, где решение эволюционировало от RAG-прототипа к агенту на основании данных и метрик, а не потому, что «так модно».

    habr.com/ru/companies/llmstart

    #RAG #LLM #ИИагенты #LangChain #LangFuse #Ragas #метрики_качества #context_engineering #мультимодальность #ии

  3. От RAG-прототипа к агенту в продакшн: путь по метрикам, а не по моде

    На связи Сергей Смирнов, AI-инженер LLMStart.ru. Сегодня расскажу о полноценном кейсе, который мы делали для компании Айтон: агенте-консультанте по 1С:УНФ, который помогает отвечать на вопросы клиентов по базе знаний, реальным диалогам поддержки и контексту конкретного обращения. Разберу всю хронологию, нюансы и путь от первой гипотезы до продакшена, которым уже пользуются клиенты. Для бизнеса этот кейс интересен как пример реальной автоматизации через ИИ: сначала ассистент для сотрудников, потом сервис для клиентов. Для технарей — подходом, где решение эволюционировало от RAG-прототипа к агенту на основании данных и метрик, а не потому, что «так модно».

    habr.com/ru/companies/llmstart

    #RAG #LLM #ИИагенты #LangChain #LangFuse #Ragas #метрики_качества #context_engineering #мультимодальность #ии

  4. От RAG-прототипа к агенту в продакшн: путь по метрикам, а не по моде

    На связи Сергей Смирнов, AI-инженер LLMStart.ru. Сегодня расскажу о полноценном кейсе, который мы делали для компании Айтон: агенте-консультанте по 1С:УНФ, который помогает отвечать на вопросы клиентов по базе знаний, реальным диалогам поддержки и контексту конкретного обращения. Разберу всю хронологию, нюансы и путь от первой гипотезы до продакшена, которым уже пользуются клиенты. Для бизнеса этот кейс интересен как пример реальной автоматизации через ИИ: сначала ассистент для сотрудников, потом сервис для клиентов. Для технарей — подходом, где решение эволюционировало от RAG-прототипа к агенту на основании данных и метрик, а не потому, что «так модно».

    habr.com/ru/companies/llmstart

    #RAG #LLM #ИИагенты #LangChain #LangFuse #Ragas #метрики_качества #context_engineering #мультимодальность #ии

  5. Self-Hosted Observability for Large Language Models Emerges

    Developers can now watch their LLM work locally using self-hosted Langfuse. This gives more control over data and insights. Learn how it works.

    #LLMOps, #Langfuse, #vLLM, #OpenSource, #AI

    newsletter.tf/self-hosted-llm-

  6. Self-Hosted Observability for Large Language Models Emerges

    Developers can now watch their LLM work locally using self-hosted Langfuse. This gives more control over data and insights. Learn how it works.

    #LLMOps, #Langfuse, #vLLM, #OpenSource, #AI

    newsletter.tf/self-hosted-llm-

  7. Self-Hosted Observability for Large Language Models Emerges

    Developers can now watch their LLM work locally using self-hosted Langfuse. This gives more control over data and insights. Learn how it works.

    #LLMOps, #Langfuse, #vLLM, #OpenSource, #AI

    newsletter.tf/self-hosted-llm-

  8. Self-Hosted Observability for Large Language Models Emerges

    Developers can now watch their LLM work locally using self-hosted Langfuse. This gives more control over data and insights. Learn how it works.

    #LLMOps, #Langfuse, #vLLM, #OpenSource, #AI

    newsletter.tf/self-hosted-llm-

  9. Self-Hosted Observability for Large Language Models Emerges

    Developers can now watch their LLM work locally using self-hosted Langfuse. This gives more control over data and insights. Learn how it works.

    #LLMOps, #Langfuse, #vLLM, #OpenSource, #AI

    newsletter.tf/self-hosted-llm-

  10. Running your Large Language Models locally with Langfuse is now easier. This new method gives developers more control over their data compared to cloud services.

    #LLMOps, #Langfuse, #vLLM, #OpenSource, #AI
    newsletter.tf/self-hosted-llm-

  11. Running your Large Language Models locally with Langfuse is now easier. This new method gives developers more control over their data compared to cloud services.

    #LLMOps, #Langfuse, #vLLM, #OpenSource, #AI
    newsletter.tf/self-hosted-llm-

  12. Running your Large Language Models locally with Langfuse is now easier. This new method gives developers more control over their data compared to cloud services.

    #LLMOps, #Langfuse, #vLLM, #OpenSource, #AI
    newsletter.tf/self-hosted-llm-

  13. Running your Large Language Models locally with Langfuse is now easier. This new method gives developers more control over their data compared to cloud services.

    #LLMOps, #Langfuse, #vLLM, #OpenSource, #AI
    newsletter.tf/self-hosted-llm-

  14. Running your Large Language Models locally with Langfuse is now easier. This new method gives developers more control over their data compared to cloud services.

    #LLMOps, #Langfuse, #vLLM, #OpenSource, #AI
    newsletter.tf/self-hosted-llm-

  15. Как мы построили корпоративную LLM-платформу: архитектура, грабли и выводы

    Обычно внедрение AI в компаниях происходит по такому сценарию: собрали одного ассистента, показали руководству, получили аплодисменты. Потом второго, третьего — и через полгода получается зоопарк с разными ключами, моделями и неконтролируемым бюджетом. Вместо набора разрозненных ассистентов мы сразу пошли в платформу. В статье рассказываем, из чего она состоит, как эволюционировало наше железо, зачем понадобилось два слоя наблюдаемости и почему маркетплейсный RAG ломается на PDF-файлах. С графиками, схемой архитектуры и выводами, которые сами хотели бы прочитать год назад.

    habr.com/ru/companies/sminex_d

    #ai #llm #openwebui #langflow #langfuse #litellm #vllm #openai

  16. Как мы построили корпоративную LLM-платформу: архитектура, грабли и выводы

    Обычно внедрение AI в компаниях происходит по такому сценарию: собрали одного ассистента, показали руководству, получили аплодисменты. Потом второго, третьего — и через полгода получается зоопарк с разными ключами, моделями и неконтролируемым бюджетом. Вместо набора разрозненных ассистентов мы сразу пошли в платформу. В статье рассказываем, из чего она состоит, как эволюционировало наше железо, зачем понадобилось два слоя наблюдаемости и почему маркетплейсный RAG ломается на PDF-файлах. С графиками, схемой архитектуры и выводами, которые сами хотели бы прочитать год назад.

    habr.com/ru/companies/sminex_d

    #ai #llm #openwebui #langflow #langfuse #litellm #vllm #openai

  17. Как мы построили корпоративную LLM-платформу: архитектура, грабли и выводы

    Обычно внедрение AI в компаниях происходит по такому сценарию: собрали одного ассистента, показали руководству, получили аплодисменты. Потом второго, третьего — и через полгода получается зоопарк с разными ключами, моделями и неконтролируемым бюджетом. Вместо набора разрозненных ассистентов мы сразу пошли в платформу. В статье рассказываем, из чего она состоит, как эволюционировало наше железо, зачем понадобилось два слоя наблюдаемости и почему маркетплейсный RAG ломается на PDF-файлах. С графиками, схемой архитектуры и выводами, которые сами хотели бы прочитать год назад.

    habr.com/ru/companies/sminex_d

    #ai #llm #openwebui #langflow #langfuse #litellm #vllm #openai

  18. Как мы построили корпоративную LLM-платформу: архитектура, грабли и выводы

    Обычно внедрение AI в компаниях происходит по такому сценарию: собрали одного ассистента, показали руководству, получили аплодисменты. Потом второго, третьего — и через полгода получается зоопарк с разными ключами, моделями и неконтролируемым бюджетом. Вместо набора разрозненных ассистентов мы сразу пошли в платформу. В статье рассказываем, из чего она состоит, как эволюционировало наше железо, зачем понадобилось два слоя наблюдаемости и почему маркетплейсный RAG ломается на PDF-файлах. С графиками, схемой архитектуры и выводами, которые сами хотели бы прочитать год назад.

    habr.com/ru/companies/sminex_d

    #ai #llm #openwebui #langflow #langfuse #litellm #vllm #openai

  19. Как подключить Langfuse к LLM через JWT?

    Langfuse, помимо трассирования запросов, удобно использовать для prompt management и LLM-as-a-judge. Но в закрытой корпоративной среде он упирается в простую вещь: LF работает со статическим API key, а ваш LLM gateway — нет. То есть gateway требует короткоживущий JWT, а Langfuse не умеет его получать. И в этот момент интеграция ломается. Мы столкнулись именно с такой ситуацией. Модели self-hosted, OpenAI подобный API, но для доступа к нему на каждый запрос нужен JWT, который выдаётся централизованным провайдером. Langfuse в LLM Connection умеет передать API key и заголовки, но не сможет сам сходить в auth-сервис, получить временный токен и подставить его в запрос. В этой статье я рассказываю о своем опыте решения этой проблемы на продакшен уровне.

    habr.com/ru/articles/1025168/

    #llm #litellm #fastapi #proxy #proxyserver #langfuse

  20. Как подключить Langfuse к LLM через JWT?

    Langfuse, помимо трассирования запросов, удобно использовать для prompt management и LLM-as-a-judge. Но в закрытой корпоративной среде он упирается в простую вещь: LF работает со статическим API key, а ваш LLM gateway — нет. То есть gateway требует короткоживущий JWT, а Langfuse не умеет его получать. И в этот момент интеграция ломается. Мы столкнулись именно с такой ситуацией. Модели self-hosted, OpenAI подобный API, но для доступа к нему на каждый запрос нужен JWT, который выдаётся централизованным провайдером. Langfuse в LLM Connection умеет передать API key и заголовки, но не сможет сам сходить в auth-сервис, получить временный токен и подставить его в запрос. В этой статье я рассказываю о своем опыте решения этой проблемы на продакшен уровне.

    habr.com/ru/articles/1025168/

    #llm #litellm #fastapi #proxy #proxyserver #langfuse

  21. Как подключить Langfuse к LLM через JWT?

    Langfuse, помимо трассирования запросов, удобно использовать для prompt management и LLM-as-a-judge. Но в закрытой корпоративной среде он упирается в простую вещь: LF работает со статическим API key, а ваш LLM gateway — нет. То есть gateway требует короткоживущий JWT, а Langfuse не умеет его получать. И в этот момент интеграция ломается. Мы столкнулись именно с такой ситуацией. Модели self-hosted, OpenAI подобный API, но для доступа к нему на каждый запрос нужен JWT, который выдаётся централизованным провайдером. Langfuse в LLM Connection умеет передать API key и заголовки, но не сможет сам сходить в auth-сервис, получить временный токен и подставить его в запрос. В этой статье я рассказываю о своем опыте решения этой проблемы на продакшен уровне.

    habr.com/ru/articles/1025168/

    #llm #litellm #fastapi #proxy #proxyserver #langfuse

  22. Как подключить Langfuse к LLM через JWT?

    Langfuse, помимо трассирования запросов, удобно использовать для prompt management и LLM-as-a-judge. Но в закрытой корпоративной среде он упирается в простую вещь: LF работает со статическим API key, а ваш LLM gateway — нет. То есть gateway требует короткоживущий JWT, а Langfuse не умеет его получать. И в этот момент интеграция ломается. Мы столкнулись именно с такой ситуацией. Модели self-hosted, OpenAI подобный API, но для доступа к нему на каждый запрос нужен JWT, который выдаётся централизованным провайдером. Langfuse в LLM Connection умеет передать API key и заголовки, но не сможет сам сходить в auth-сервис, получить временный токен и подставить его в запрос. В этой статье я рассказываю о своем опыте решения этой проблемы на продакшен уровне.

    habr.com/ru/articles/1025168/

    #llm #litellm #fastapi #proxy #proxyserver #langfuse

  23. Planning to make large behavioural changes to a (sometimes long-running) production-grade AI agent. Working with `pydantic-evals` today because I want to eval the agent before and after. So far it looks very similar to Langfuse datasets/runs for evalling, except that the data lives in your repository instead of in the Langfuse platform.

    ai.pydantic.dev/evals/

  24. Наблюдаемость LLM-агентов: Часть 2. Разработка и отладка графа

    Привет, Хабр! Меня зовут Владимир и это вторая часть материала о трассировке LLM-агентов. В первой части мы настроили инфраструктуру: подняли LangFuse, организовали трассировку и научились управлять промптами как кодом. Если вы ещё не читали — рекомендую начать с неё. В этой части перейдём от теории к практике: соберём агента, который пишет сказки. В графе будут задействованы инструменты, условные переходы и циклы обратной связи.

    habr.com/ru/articles/1008402/

    #langgraph #langfuse

  25. Наблюдаемость LLM-агентов: Часть 1. Трассировка LangGraph и версионирование промптов с LangFuse

    Привет, Хабр! Меня зовут Владимир и в последнее время я занимаюсь разработкой агентов на LangGraph. Отладка LangGraph-агента - это отдельная боль: когда граф начинает жить своей жизнью, а LLM уходит в бесконечные циклы, понять, что случилось, становится сложно. В этой статье я покажу, как связать LangGraph с LangFuse для трассировки и покажу как управлять промптами как кодом (версионирование и миграция).

    habr.com/ru/articles/1008300/

    #langfuse #langgraph

  26. Как я научил AI анализировать AI: observability для LLM-агентов с Langfuse

    Как я построил систему мониторинга LLM-приложений и научил AI анализировать собственные ошибки AI-ассистенты в IDE стали незаменимыми помощниками разработчиков, но остаются чёрными ящиками. Мы не видим что они делают "под капотом", сколько это стоит и где теряется время. В статье покажу как построить системуobservability для AI-агентов: от Cursor IDE до production, с AI-анализом трейсов и открытым исходным кодом.

    habr.com/ru/articles/987230/

    #AI_observability #LLM_monitoring #langfuse #cursor #agentic_ai

  27. Как я научил AI анализировать AI: observability для LLM-агентов с Langfuse

    Как я построил систему мониторинга LLM-приложений и научил AI анализировать собственные ошибки AI-ассистенты в IDE стали незаменимыми помощниками разработчиков, но остаются чёрными ящиками. Мы не видим что они делают "под капотом", сколько это стоит и где теряется время. В статье покажу как построить системуobservability для AI-агентов: от Cursor IDE до production, с AI-анализом трейсов и открытым исходным кодом.

    habr.com/ru/articles/987230/

    #AI_observability #LLM_monitoring #langfuse #cursor #agentic_ai

  28. Как я научил AI анализировать AI: observability для LLM-агентов с Langfuse

    Как я построил систему мониторинга LLM-приложений и научил AI анализировать собственные ошибки AI-ассистенты в IDE стали незаменимыми помощниками разработчиков, но остаются чёрными ящиками. Мы не видим что они делают "под капотом", сколько это стоит и где теряется время. В статье покажу как построить системуobservability для AI-агентов: от Cursor IDE до production, с AI-анализом трейсов и открытым исходным кодом.

    habr.com/ru/articles/987230/

    #AI_observability #LLM_monitoring #langfuse #cursor #agentic_ai

  29. Как я научил AI анализировать AI: observability для LLM-агентов с Langfuse

    Как я построил систему мониторинга LLM-приложений и научил AI анализировать собственные ошибки AI-ассистенты в IDE стали незаменимыми помощниками разработчиков, но остаются чёрными ящиками. Мы не видим что они делают "под капотом", сколько это стоит и где теряется время. В статье покажу как построить системуobservability для AI-агентов: от Cursor IDE до production, с AI-анализом трейсов и открытым исходным кодом.

    habr.com/ru/articles/987230/

    #AI_observability #LLM_monitoring #langfuse #cursor #agentic_ai

  30. 🎉 Breaking news: #ClickHouse swallows #Langfuse whole! 🤯 Don't worry, dear user, absolutely nothing will change... except everything. Welcome to the magical world where acquisitions mean "business as usual" and your roadmap is still shrouded in ✨ corporate mystery ✨.
    langfuse.com/blog/joining-clic #Acquisition #BusinessAsUsual #CorporateMystery #DataNews #HackerNews #ngated

  31. 🎉 Breaking news: #ClickHouse swallows #Langfuse whole! 🤯 Don't worry, dear user, absolutely nothing will change... except everything. Welcome to the magical world where acquisitions mean "business as usual" and your roadmap is still shrouded in ✨ corporate mystery ✨.
    langfuse.com/blog/joining-clic #Acquisition #BusinessAsUsual #CorporateMystery #DataNews #HackerNews #ngated

  32. 🎉 Breaking news: #ClickHouse swallows #Langfuse whole! 🤯 Don't worry, dear user, absolutely nothing will change... except everything. Welcome to the magical world where acquisitions mean "business as usual" and your roadmap is still shrouded in ✨ corporate mystery ✨.
    langfuse.com/blog/joining-clic #Acquisition #BusinessAsUsual #CorporateMystery #DataNews #HackerNews #ngated

  33. 🎉 Breaking news: #ClickHouse swallows #Langfuse whole! 🤯 Don't worry, dear user, absolutely nothing will change... except everything. Welcome to the magical world where acquisitions mean "business as usual" and your roadmap is still shrouded in ✨ corporate mystery ✨.
    langfuse.com/blog/joining-clic #Acquisition #BusinessAsUsual #CorporateMystery #DataNews #HackerNews #ngated

  34. Langfuse: наблюдаем и отлаживаем LLM-микросервисы без black box

    За прошлый год я запустил 5 сервисов с LLM под капотом . Каждый следующий сервис получался лучше предыдущего: мы оттачивали архитектуру, оптимизировали core микросервиса на FastAPI, быстрее выходили на MVP и ловили меньше багов. Но довольно быстро стало понятно: LLM‑сервисы сложно интерпретировать . Для бизнес команды они выглядят как black box. Для инженеров — как набор плохо воспроизводимых состояний. В этой статье я поделюсь практиками, которые: — упрощают интерпретацию поведения LLM; — делают работу сервиса прозрачной для Product Owners и SME; — ускоряют разработку и итерации без передеплоев.

    habr.com/ru/articles/983462/

    #langfuse #python #fastapi #llm #ai

  35. Больше никаких «черных ящиков»: мониторим и оцениваем качество LLM-приложений с Langfuse

    Представьте: вы ведете автомобиль, а на приборной панели нет ни спидометра, ни датчика топлива, ни каких-либо показателей вообще. Ни-че-го. В принципе ехать можно, но вы не знаете, какая у вас скорость, сколько бензина и есть ли с авто какие-то проблемы. Примерно так выглядит работа с LLM-приложением без инструментов мониторинга: система вроде бы и функционирует, но о ее внутреннем состоянии можно только догадываться. Меня зовут Александр Сесоров, я работаю инженером по тестированию

    habr.com/ru/companies/yadro/ar

    #langfuse #llm #тестирование #qa #python #анализ_и_проектирование_систем #искусственный_интеллект

  36. Abstraction mang lại tiện lợi nhưng ẩn chi phí: như khi chuyển từ mua CD sang dịch vụ streaming, hay dùng LangChain/LangSmith để xây dựng LLM. Miễn phí giới hạn, sau đó trả phí và có nguy cơ vendor lock‑in. Hãy cân nhắc lợi‑nhuận trước khi chấp nhận sự trừu tượng. #Abstraction #Developer #Tech #PhầnMềm #CôngNghệ #LangChain #LangSmith #Langfuse

    dev.to/solomonaboyeji/the-hidd

  37. Установка Langfuse в Kubernetes

    В этой статье разберу установку с минимальными усилиями с использованием Helm и локального однонодового кластера Kubeadm.

    habr.com/ru/articles/963250/

    #langfuse #k8s #kubernetes

  38. Интеграция Langfuse с приложением .NET

    Несмотря на растущую популярность платформы Langfuse для отладки и контроля LLM ориентированных приложений, на момент написания статьи экосистема .NET остается без официальной поддержки. На момент написания статьи готовые SDK доступны только разработчикам на Python и JavaScript/TypeScript. Однако есть возможность интеграции с помощью стандарта OpenTelemetry. И в данной статье будет приведен один из примеров как это сделать.

    habr.com/ru/articles/960156/

    #langfuse #c#

  39. От LangChain к LangGraph: детально разбираемся с фреймворками и всей Lang-экосистемой

    LangChain или LangGraph? Какой фреймворк для ии-агентов выбрать? А может быть LangSmith? Или LangFuse? LangFlow? Если вы сходу не отличаете все эти Lang-что-то там между собой или просто хочется побольше узнать о внутренностях LangChain и LangGraph, то добро пожаловать в эту статью, которую мне хотелось сделать фундаментальной, чтобы ответить сразу на все возникающие вокруг LangChain вопросы. Поговорим про архитектурные различия между LangChain и LangGraph, их подходы, посмотрим как это выглядит в коде, поищем лучшие точки применения и взглянем на сформированную экосистему вокруг.

    habr.com/ru/articles/956940/

    #langchain #langgraph #langfuse #langsmith #langflow #ленгчейн #фреймворки #llm #большие_языковые_модели #ииагенты

  40. Security-RAG или как сделать AI Security tool на коленке

    LLM-ки и LLM-агенты продолжают наводить шум. Cтатьи про то как сделать очередной RAG или Агента продолжают клепаться (да блин даже мы одна из этих статей), huggingface выпускают smolagents , квантизация позволяет дойти LLM-кам до простых работяг и обывателей, давая им возможность в них потыкаться в той же LM studio или других приложениях. Пока бизнес спешит внедрить очередного виртуального помощника, тот зачастую превращается в неумелого продавца, который не только мешает клиентам связаться со службой поддержки, но и... Удиви меня

    habr.com/ru/articles/874820/

    #llm #llmattack #llmприложения #ml #langchain #langfuse #chromadb #промптинъекции #искусственный_интеллект

  41. Security-RAG или как сделать AI Security tool на коленке

    LLM-ки и LLM-агенты продолжают наводить шум. Cтатьи про то как сделать очередной RAG или Агента продолжают клепаться (да блин даже мы одна из этих статей), huggingface выпускают smolagents , квантизация позволяет дойти LLM-кам до простых работяг и обывателей, давая им возможность в них потыкаться в той же LM studio или других приложениях. Пока бизнес спешит внедрить очередного виртуального помощника, тот зачастую превращается в неумелого продавца, который не только мешает клиентам связаться со службой поддержки, но и... Удиви меня

    habr.com/ru/articles/874820/

    #llm #llmattack #llmприложения #ml #langchain #langfuse #chromadb #промптинъекции #искусственный_интеллект

  42. Security-RAG или как сделать AI Security tool на коленке

    LLM-ки и LLM-агенты продолжают наводить шум. Cтатьи про то как сделать очередной RAG или Агента продолжают клепаться (да блин даже мы одна из этих статей), huggingface выпускают smolagents , квантизация позволяет дойти LLM-кам до простых работяг и обывателей, давая им возможность в них потыкаться в той же LM studio или других приложениях. Пока бизнес спешит внедрить очередного виртуального помощника, тот зачастую превращается в неумелого продавца, который не только мешает клиентам связаться со службой поддержки, но и... Удиви меня

    habr.com/ru/articles/874820/

    #llm #llmattack #llmприложения #ml #langchain #langfuse #chromadb #промптинъекции #искусственный_интеллект

  43. Security-RAG или как сделать AI Security tool на коленке

    LLM-ки и LLM-агенты продолжают наводить шум. Cтатьи про то как сделать очередной RAG или Агента продолжают клепаться (да блин даже мы одна из этих статей), huggingface выпускают smolagents , квантизация позволяет дойти LLM-кам до простых работяг и обывателей, давая им возможность в них потыкаться в той же LM studio или других приложениях. Пока бизнес спешит внедрить очередного виртуального помощника, тот зачастую превращается в неумелого продавца, который не только мешает клиентам связаться со службой поддержки, но и... Удиви меня

    habr.com/ru/articles/874820/

    #llm #llmattack #llmприложения #ml #langchain #langfuse #chromadb #промптинъекции #искусственный_интеллект

  44. Контроль и порядок. Разворачиваем платформу учёта затравок для БЯМ

    Все мы знаем, что Гит здорово облегчает жизнь разработчикам. Версионирование позволяет нам вернуться на шаг назад, если мы где-то жестко напортачили. А еще оно помогает отслеживать изменения, которые мы вносим в код. Весь код и история изменений хранятся на сервере, через который может работать команда разрабов. Одним словом, удобно. Под катом расскажу, как поднять платформу для учета и версионирования затравок Langfuse. (Обложка сгенерирована DALL-E от OpenAI)

    habr.com/ru/articles/874164/

    #затравка #промптинг #версионирование_промптов #промпт_деплоймент #git_для_промптов #langfuse #пситехлаб

  45. [Перевод] Оценка LLM: комплексные оценщики и фреймворки оценки

    В этой статье подробно описываются сложные статистические и предметно-ориентированные оценщики, которые можно использовать для оценки производительности крупных языковых моделей. В ней также рассматриваются наиболее широко используемые фреймворки оценки LLM, которые помогут вам начать оценивать производительность модели.

    habr.com/ru/articles/855644/

    #llm #BLEU #ROUGE #METEOR #BERTScore #MoverScore #DeepEval #Giskard #promptfoo #LangFuse

  46. [Перевод] Оценка LLM: комплексные оценщики и фреймворки оценки

    В этой статье подробно описываются сложные статистические и предметно-ориентированные оценщики, которые можно использовать для оценки производительности крупных языковых моделей. В ней также рассматриваются наиболее широко используемые фреймворки оценки LLM, которые помогут вам начать оценивать производительность модели.

    habr.com/ru/articles/855644/

    #llm #BLEU #ROUGE #METEOR #BERTScore #MoverScore #DeepEval #Giskard #promptfoo #LangFuse