home.social

Search

11 results for “arizeai”

  1. .@JohnGilhuly is bringing the Cursor angle to Observe. What does it actually take to operate AI inside the developer workflow at the scale Cursor sees?

    If you've watched the engineering teams at your company quietly stop writing code without an AI in the loop, you'll want to hear how Cursor thinks about quality and trust in that workflow.

    June 4, SF: arize.com/observe

  2. 🎙️ Builders. Practitioners. Researchers. Thought leaders. If you're shaping the future of AI, Observe 26 wants YOU on stage.

    We're looking for voices working on LLM evaluation, AI agents, observability, and shipping AI to production.

    Observe 2026 | June 4 | Shack15, San Francisco

    Apply to speak 👇
    docs.google.com/forms/d/e/1FAI

  3. Arize AX + AWS Bedrock AgentCore = a complete production system where you can deploy agents with confidence and improve them continuously based on real data.

    From the floor of , a new notebook + blog runs through a travel planning agent example.

    Dive in: arize.com/blog/aws-bedrock-age

  4. Microsoft Foundry + Arize AX = everything you need for self-improving agents.

    From the floor of , a new notebook + blog walks through a concrete content safety evaluation example.

    📓 Explore: arize.com/blog/evaluating-and-

  5. TubeMogul execs launch Arize AI for AI troublehsooting - A new startup called Arize AI is building what it calls a real-time analytics platform for artificia... more: feedproxy.google.com/~r/Techcr #artificialintelligence #foundationcapital #fundings&exits #ycombinator #startups

  6. [Перевод] 5 лучших фреймворков с открытым исходным кодом для оценки больших языковых моделей (LLM) в 2024 году

    «У меня такое чувство, что решений для оценки LLM больше, чем проблем, связанных с их оценкой», — сказал Дилан, руководитель отдела ИИ в компании из списка Fortune 500. И я полностью согласен — кажется, что каждую неделю появляется новый репозиторий с открытым исходным кодом, пытающийся сделать то же самое, что и другие 30+ уже существующих фреймворков. В конце концов, чего действительно хочет Дилан, так это фреймворка, пакета, библиотеки, как угодно, который просто количественно оценил бы производительность LLM (приложения), которую он хочет запустить в продакшен. Итак, как человек, который когда-то был на месте Дилана, я составил список из 5 лучших фреймворков для оценки LLM, существующих в 2024 году :) 😌 Начнем!

    habr.com/ru/articles/865212/

    #deepeval #mlflow #rag #ragas #llm #arize_ai