home.social

#glm-4-5 — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #glm-4-5, aggregated by home.social.

fetched live
  1. 🎯 Real-world validation through extended #CCBench testing with human evaluators completing multi-turn tasks in isolated #Docker containers across frontend development, tool building, data analysis, testing & algorithms

    🔧 Near parity with #ClaudeSonnet4 (48.6% win rate) while outperforming other #opensource baselines in practical scenarios

    ⚙️ 15% more token-efficient than #GLM45, finishing tasks with fewer tokens while maintaining higher capability levels

  2. 🚀 Welcome GLM-4.6 the Latest flagship #opensource #AI #llm with advanced agentic, reasoning & coding capabilities

    ⚡ Performance improvements over #GLM45 with competitive advantages against #DeepSeekV3 and #ClaudeSonnet4 across 8 public benchmarks covering agents, reasoning & coding

    🧵 👇

  3. Claude Code за $3/месяц и 2 новые «стелс» модели: потестил за вас

    На выходных вышли сразу две громкие ИИ-новости, которые захотелось пощупать руками. Во-первых, на OpenRouter тихо появились две стелс-модели: Sonoma Dusk Alpha и Sky Alpha . Обе заявлены с окном контекста 2 млн токенов, поддержкой изображений на входе и параллельным вызовом инструментов, и сейчас бесплатны ; Dusk заявляется как быстрая модель на каждый день, Sky - как максимально интеллектуальная для сложных задач. Во-вторых, z.ai запустили API совместимый с Claude Code с доступом к своей флагманской модели GLM-4.5 по за $3/мес (план GLM Coding Lite ) — с лимитом ~120 промтов на каждые 5 часов. Есть и Pro за $15/мес (~600 промтов/5 ч). Эти планы работают только внутри инструментов кодинга вроде Claude Code (в веб-чате их не включают). Ну как не потестить? Потестим.

    habr.com/ru/articles/945066/

    #glm45 #claude_code #zai #cline #ииразработка

  4. Tässä ilmainen korvike ChatGPT:lle, joka on yllättäen yhtä hyvä (ja parempi kun ilmainen ChatGPT!) 👉 youtu.be/EbOf0QysyBA

    Tässä on #tekoäly, joka pystyy yhtä hyvään jälkeen kun ChatGPT, mutta se on täysin ilmainen ja myös ajettavissa omalla raudalla jos et luota pilvipalveluihin! GLM 4.5-malli on päättelevä, nopea, osaa hakea tietoa ja sen erikoisuus on kyky tuottaa laadukkaita esityksiä.

    #GLM45 #Tekoälymalli
    youtu.be/EbOf0QysyBA

  5. Chiński Z.ai rzuca rękawicę gigantom. Nowy model AI GLM-4.5 ma być otwarty, tani i rekordowo wydajny

    I lepszy od modelu DeepSeek. Startup Z.ai zaprezentował nowe rozwiązanie – GLM-4.5. Jest to model AI udostępniony w formule open source, który ma być jeszcze tańszy, wydajniejszy i „bystrzejszy” od swojego głośnego, chińskiego poprzednika.

    Nowy model, GLM-4.5, wyróżnia się tak zwaną „agentową” architekturą, co oznacza, że potrafi automatycznie dzielić złożone zadania na mniejsze etapy, by wykonać je precyzyjniej. Co więcej, jest o połowę mniejszy od DeepSeeka i do działania potrzebuje podobno zaledwie ośmiu specjalistycznych chipów Nvidia H20, stworzonych na potrzeby chińskiego rynku z uwzględnieniem amerykańskich restrykcji eksportowych.

    Nowy model GLM-4.5 to dziś najbardziej zaawansowana (publicznie znana) chińska konstrukcja oparta na architekturze MoE (Mixture of Experts), dostępna w dwóch wariantach: flagowym z 355 miliardami parametrów oraz lżejszej wersji Air ze 106 miliardami parametrów. Architektura „agentowa” pozwala mu na autonomiczne planowanie i wykonywanie złożonych, wieloetapowych zadań. Według testów producenta, model Z.ai osiągnął trzeci wynik na świecie w branżowych benchmarkach, plasując się jednocześnie na pierwszym miejscu wśród wszystkich modeli typu open-source. Co niezwykle istotne, jego wysoka wydajność została osiągnięta przy relatywnie niskich wymaganiach sprzętowych.

    Z.ai pozycjonuje swój produkt jako „prawdziwie otwartą alternatywę” dla zamkniętych, autorskich systemów, które dominują na rynku. Model jest dostępny na otwartej licencji, co daje firmom większą kontrolę i transparentność. Jednak to właśnie koszty stanowią jego największą przewagę. Według oficjalnego cennika, koszt przetwarzania miliona tokenów (fragmentów słów) to zaledwie 11 centów za dane wejściowe i 28 centów za dane wyjściowe. Dla porównania, w przypadku konkurencyjnego modelu DeepSeek R1 koszt tokenów wyjściowych to 2,19 dolara, co pokazuje ogromny (wręcz niewiarygodny) skok w optymalizacji kosztowej.

    Dynamiczny rozwój chińskich firm AI ma coraz większe znaczenie geopolityczne. Gdy na początku roku DeepSeek zaprezentował swoją wydajność, wywołało to chwilowe załamanie kursów akcji amerykańskich gigantów technologicznych. Sukcesy Z.ai, firmy założonej w 2019 roku, która zebrała już ponad 1,5 mld dolarów od inwestorów takich jak Alibaba i Tencent, również nie pozostały niezauważone. Firma została wymieniona przez OpenAI jako jeden z nielicznych na świecie konkurentów zdolnych do budowy rywalizujących modeli, a także trafiła do prestiżowego raportu Stanford University „AI Index Report 2025”. Jednocześnie ten szybki postęp wzbudził niepokój w Waszyngtonie – startup Z.ai został wpisany na listę podmiotów objętych amerykańskimi restrykcjami handlowymi.

    Trening modelu DeepSeek nie kosztował 6 mln dolarów, lecz 1,3 miliarda dolarów – raport SemiAnalysis

    #AI #chiny #DeepSeek #geopolityka #GLM45 #MixtureOfExperts #modelJęzykowy #modeleJęzykowe #news #openSource #sztucznaInteligencja #technologia #usa #ZAi #Zhipu

  6. #GLM45 frontier #AI #LLM with 355B parameters ranks 3rd against #OpenAI #Claude4 #Gemini across benchmarks 🤖

    🧠 Two variants: GLM-4.5 (355B total/32B active parameters) and GLM-4.5-Air (106B total/12B active)
    🔄 Hybrid reasoning models with thinking mode for complex tasks and non-thinking mode for instant responses
    🏆 Ranks 3rd overall against #OpenAI, #Anthropic, #Google #DeepMind models across 12 benchmarks

    🧵 👇