home.social

#leaderboard — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #leaderboard, aggregated by home.social.

  1. What Stanford’s HAI Report Says About AI in Science Progress in artificial intelligence continues to accelerate across a range of expert disciplines, according to the latest AI Index report publi...

    #Features #AI #for #Science #AION-1 #Arena #Leaderboard #ChemBench #FourCastNet3 #Humanity's #Last

    Origin | Interest | Match
  2. LLM модели: зарубежные VS отечественные

    Когда команда выбирает LLM для продакшена, «сравнение по бенчмаркам» — это лишь первый фильтр. Для CTO ключевой вопрос звучит иначе: какую комбинацию качества, стоимости, стабильности API, юридических ограничений и интеграций мы получим на реальной нагрузке. Я разобрал популярные модели через призму двух контуров: качество/бенчмарки и инфраструктурная пригодность.

    habr.com/ru/articles/1000058/

    #llmмодели #llm #mera #leaderboard #tco #sla

  3. 🗺️ Đã ra mắt ứng dụng web "GPX Fog of War": bản đồ toàn cầu được che mờ, mở khoá khi tải file GPX hoạt động của bạn. Có bảng xếp hạng toàn thế giới, quốc gia, thành phố và thống kê chi tiết theo hoạt động. Xem hồ sơ người dùng (tuỳ chọn riêng tư) để khám phá bản đồ của họ.
    #GPX #FogOfWar #WebApp #Map #Leaderboard #CôngNghệ #ĐịaĐồ

    reddit.com/r/SideProject/comme

  4. Анатомия Prompt Injection: Как я вошел в топ-10 глобального рейтинга Lakera Agent Breaker

    Как пробить многоуровневую защиту LLM-агента, обученную на 80+ млн атаках? В декабре 2025 я вошел в топ-10 глобального рейтинга Lakera Agent Breaker. В этой статье - не просто обзор решения, а детальный разбор уязвимостей современных LLM-систем и архитектура кастомного фаззинг-пайплайна.

    habr.com/ru/articles/979476/

    #информационная_безопасность #искусственный_интеллект #llm #языковые_модели #хакатон #cybersecurity #ai #leaderboard #ctf #bughunting

  5. 🎓 Ah, the age-old struggle of backpressure: a term that just sounds like a gastrointestinal condition, yet it's somehow vital to your glorified #Excel sheet #leaderboard. 🏆 Let's pretend that #juggling packets and messages is the modern-day equivalent of scaling Everest, while we all know it's just a fancy way of saying "don't break the #internet, please." 🙄
    blog.pranshu-raj.me/posts/back #backpressure #safety #packet #modern #challenges #HackerNews #ngated