home.social

#opus45 — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #opus45, aggregated by home.social.

  1. Moonshot AI just released Kimi K2.5, an open‑source LLM that beats the proprietary Opus 4.5 on benchmarks. The model is freely available, community‑ready, and pushes the frontier of accessible AI. Dive into the details to see why Kimi K2.5 could be the next big step for open‑source ML. #MoonshotAI #KimiK2_5 #OpenSourceLLM #Opus45

    🔗 aidailypost.com/news/moonshot-

  2. Anthropic prezentuje Claude Opus 4.5. Nowy król kodowania jest tańszy i ma lepszą pamięć

    Anthropic nie zwalnia tempa i oficjalnie wprowadza na rynek swój nowy flagowy model – Claude Opus 4.5.

    Aktualizacja przynosi znaczący skok wydajności, zwłaszcza w zadaniach programistycznych, a także rozwiązuje jeden z największych problemów użytkowych poprzednich wersji. Co istotne dla deweloperów, nowy model jest znacznie tańszy w eksploatacji niż jego poprzednik.

    Koniec z „uciętymi” rozmowami

    Dla przeciętnego użytkownika korzystającego z aplikacji Claude (web, mobile, desktop), najważniejszą zmianą jest nowy sposób zarządzania pamięcią konwersacji. Dotychczas, po przekroczeniu limitu okna kontekstowego (200 000 tokenów), Claude po prostu ucinał rozmowę, uniemożliwiając jej kontynuowanie. Było to frustrujące, zwłaszcza w długich sesjach roboczych.

    Wraz z premierą Opus 4.5 (zmiana ta dotyczy wszystkich modeli w aplikacjach), Anthropic wprowadza mechanizm inteligentnego podsumowywania. Gdy rozmowa zbliża się do limitu, system „w tle” skróci starsze wątki, zachowując kluczowe informacje, a odrzucając zbędne detale. Dzięki temu konwersacja może trwać znacznie dłużej bez utraty spójności.

    Lepszy od GPT-5.1 i Gemini 3

    Opus 4.5 to pierwszy model, który przekroczył barierę 80 proc. dokładności w prestiżowym benchmarku programistycznym SWE-bench Verified, osiągając wynik 80,9 proc. Tym samym zdetronizował on niedawno wydane modele konkurencji: GPT-5.1-Codex-Max od OpenAI (77,9 proc.) oraz Gemini 3 Pro od Google (76,2 proc.). Choć Claude nadal ustępuje rywalom w rozumowaniu wizualnym, w zadaniach związanych z kodowaniem i używaniem narzędzi (agentic tool use) wysuwa się na prowadzenie.

    Niższe ceny i nowości dla deweloperów

    Anthropic zdecydował się na agresywną politykę cenową. Dostęp do API Opus 4.5 kosztuje teraz 5 dolarów za milion tokenów wejściowych i 25 dolarów za wyjściowe. To drastyczna obniżka względem poprzednika, który kosztował odpowiednio 15 i 75 dolarów.

    Dodatkowo, środowisko Claude Code, wcześniej dostępne głównie przez linię komend, trafiło natywnie do aplikacji desktopowych. Nowy interfejs pozwala na wygodne przełączanie się między tradycyjnym czatem a środowiskiem programistycznym w kartach. Deweloperzy otrzymali też nowy parametr „effort”, pozwalający precyzyjnie balansować między dokładnością modelu a zużyciem tokenów.

    Sojusz tytanów AI. Microsoft, Nvidia i Anthropic wchodzą w układ za 30 mld dolarów. Koniec przewagi OpenAI?

    #aiSi #anthropic #claude #gemini3 #gpt51 #news #opus45 #programowanie #sztucznaInteligencja

  3. #Anthropic released #Opus45, the latest version of its flagship model, featuring state-of-the-art performance on various benchmarks. The model boasts improved #computeruse and #spreadsheetcapabilities. Additionally, Opus 4.5 includes #memoryimprovements for #longcontext operations and an “#endlesschat” feature for paid users. techcrunch.com/2025/11/24/anth #tech #media #news

  4. #Anthropic released #Opus45, the latest version of its flagship model, featuring state-of-the-art performance on various benchmarks. The model boasts improved #computeruse and #spreadsheetcapabilities. Additionally, Opus 4.5 includes #memoryimprovements for #longcontext operations and an “#endlesschat” feature for paid users. techcrunch.com/2025/11/24/anth #tech #media #news

  5. #Anthropic released #Opus45, the latest version of its flagship model, featuring state-of-the-art performance on various benchmarks. The model boasts improved #computeruse and #spreadsheetcapabilities. Additionally, Opus 4.5 includes #memoryimprovements for #longcontext operations and an “#endlesschat” feature for paid users. techcrunch.com/2025/11/24/anth #tech #media #news