home.social

#opus45 — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #opus45, aggregated by home.social.

  1. Boty negocjują na Allegro – Anthropic odkrywa przyszłość handlu AI

    Co się stanie, gdy na Allegro spotkają się nie ludzie, tylko ich boty – i to one się targują? W Anthropic właśnie to sprawdzono.

    Czytaj dalej:
    pressmind.org/boty-negocjuja-n

    #PressMindLabs #agenciai #allegro #anthropic #claude #opus45

  2. KI-Systeme meistern zunehmend komplexe Softwareaufgaben – Zeithorizonte werden neu bewertet

    Aktuelle KI-Modelle übertreffen bei bestimmten Klassen von Softwareaufgaben die bisherigen Erwartungen merklich. Das ist die zentrale Einschätzung von Ryan Greenblatt, KI-Sicherheitsforscher bei Redwood Research, der seine Prognosen zu Leistung und Entwicklungsgeschwindigkeit von KI-Systemen zuletzt erheblich angepasst hat.

    all-about-security.de/ki-syste

    #opus45 #kisysteme #kimodelle #Codex

  3. Last week our CEO made a big decision: he want everybody to use ClaudeCode with Opus4.5 as much as possible so now we have unlimited team account and a sort of obligation to use it!
    #ai #llm #claude #opus45 #myelixirstatus #elixirlang

  4. Last week our CEO made a big decision: he want everybody to use ClaudeCode with Opus4.5 as much as possible so now we have unlimited team account and a sort of obligation to use it!
    #ai #llm #claude #opus45 #myelixirstatus #elixirlang

  5. Last week our CEO made a big decision: he want everybody to use ClaudeCode with Opus4.5 as much as possible so now we have unlimited team account and a sort of obligation to use it!
    #ai #llm #claude #opus45 #myelixirstatus #elixirlang

  6. Last week our CEO made a big decision: he want everybody to use ClaudeCode with Opus4.5 as much as possible so now we have unlimited team account and a sort of obligation to use it!
    #ai #llm #claude #opus45 #myelixirstatus #elixirlang

  7. Last week our CEO made a big decision: he want everybody to use ClaudeCode with Opus4.5 as much as possible so now we have unlimited team account and a sort of obligation to use it!
    #ai #llm #claude #opus45 #myelixirstatus #elixirlang

  8. Moonshot AI just released Kimi K2.5, an open‑source LLM that beats the proprietary Opus 4.5 on benchmarks. The model is freely available, community‑ready, and pushes the frontier of accessible AI. Dive into the details to see why Kimi K2.5 could be the next big step for open‑source ML. #MoonshotAI #KimiK2_5 #OpenSourceLLM #Opus45

    🔗 aidailypost.com/news/moonshot-

  9. Moonshot AI just released Kimi K2.5, an open‑source LLM that beats the proprietary Opus 4.5 on benchmarks. The model is freely available, community‑ready, and pushes the frontier of accessible AI. Dive into the details to see why Kimi K2.5 could be the next big step for open‑source ML. #MoonshotAI #KimiK2_5 #OpenSourceLLM #Opus45

    🔗 aidailypost.com/news/moonshot-

  10. Moonshot AI just released Kimi K2.5, an open‑source LLM that beats the proprietary Opus 4.5 on benchmarks. The model is freely available, community‑ready, and pushes the frontier of accessible AI. Dive into the details to see why Kimi K2.5 could be the next big step for open‑source ML. #MoonshotAI #KimiK2_5 #OpenSourceLLM #Opus45

    🔗 aidailypost.com/news/moonshot-

  11. Moonshot AI just released Kimi K2.5, an open‑source LLM that beats the proprietary Opus 4.5 on benchmarks. The model is freely available, community‑ready, and pushes the frontier of accessible AI. Dive into the details to see why Kimi K2.5 could be the next big step for open‑source ML. #MoonshotAI #KimiK2_5 #OpenSourceLLM #Opus45

    🔗 aidailypost.com/news/moonshot-

  12. Anthropic's latest red-team results show Opus 4.5's awareness score stays under 10% of OpenAI's GPT-5 benchmark. The gap highlights a potential gray-swan risk for AI safety and raises questions for METR evaluations. Dive into the numbers and what this means for the next wave of LLM competition. #Anthropic #Opus45 #OpenAI #GPT5

    🔗 aidailypost.com/news/anthropic

  13. Anthropic's latest red-team results show Opus 4.5's awareness score stays under 10% of OpenAI's GPT-5 benchmark. The gap highlights a potential gray-swan risk for AI safety and raises questions for METR evaluations. Dive into the numbers and what this means for the next wave of LLM competition. #Anthropic #Opus45 #OpenAI #GPT5

    🔗 aidailypost.com/news/anthropic

  14. Anthropic's latest red-team results show Opus 4.5's awareness score stays under 10% of OpenAI's GPT-5 benchmark. The gap highlights a potential gray-swan risk for AI safety and raises questions for METR evaluations. Dive into the numbers and what this means for the next wave of LLM competition. #Anthropic #Opus45 #OpenAI #GPT5

    🔗 aidailypost.com/news/anthropic

  15. Anthropic's latest red-team results show Opus 4.5's awareness score stays under 10% of OpenAI's GPT-5 benchmark. The gap highlights a potential gray-swan risk for AI safety and raises questions for METR evaluations. Dive into the numbers and what this means for the next wave of LLM competition. #Anthropic #Opus45 #OpenAI #GPT5

    🔗 aidailypost.com/news/anthropic

  16. Opus 4.5 đã có mặt trong gói $20 của Claude! 🎉 Giờ đây, người dùng có thể trải nghiệm sức mạnh của mô hình AI tiên tiến này với mức giá phải chăng. #AI #ClaudeAI #Opus45 #Côngnghệ #ArtificialIntelligence

    reddit.com/r/singularity/comme

  17. Anthropic prezentuje Claude Opus 4.5. Nowy król kodowania jest tańszy i ma lepszą pamięć

    Anthropic nie zwalnia tempa i oficjalnie wprowadza na rynek swój nowy flagowy model – Claude Opus 4.5.

    Aktualizacja przynosi znaczący skok wydajności, zwłaszcza w zadaniach programistycznych, a także rozwiązuje jeden z największych problemów użytkowych poprzednich wersji. Co istotne dla deweloperów, nowy model jest znacznie tańszy w eksploatacji niż jego poprzednik.

    Koniec z „uciętymi” rozmowami

    Dla przeciętnego użytkownika korzystającego z aplikacji Claude (web, mobile, desktop), najważniejszą zmianą jest nowy sposób zarządzania pamięcią konwersacji. Dotychczas, po przekroczeniu limitu okna kontekstowego (200 000 tokenów), Claude po prostu ucinał rozmowę, uniemożliwiając jej kontynuowanie. Było to frustrujące, zwłaszcza w długich sesjach roboczych.

    Wraz z premierą Opus 4.5 (zmiana ta dotyczy wszystkich modeli w aplikacjach), Anthropic wprowadza mechanizm inteligentnego podsumowywania. Gdy rozmowa zbliża się do limitu, system „w tle” skróci starsze wątki, zachowując kluczowe informacje, a odrzucając zbędne detale. Dzięki temu konwersacja może trwać znacznie dłużej bez utraty spójności.

    Lepszy od GPT-5.1 i Gemini 3

    Opus 4.5 to pierwszy model, który przekroczył barierę 80 proc. dokładności w prestiżowym benchmarku programistycznym SWE-bench Verified, osiągając wynik 80,9 proc. Tym samym zdetronizował on niedawno wydane modele konkurencji: GPT-5.1-Codex-Max od OpenAI (77,9 proc.) oraz Gemini 3 Pro od Google (76,2 proc.). Choć Claude nadal ustępuje rywalom w rozumowaniu wizualnym, w zadaniach związanych z kodowaniem i używaniem narzędzi (agentic tool use) wysuwa się na prowadzenie.

    Niższe ceny i nowości dla deweloperów

    Anthropic zdecydował się na agresywną politykę cenową. Dostęp do API Opus 4.5 kosztuje teraz 5 dolarów za milion tokenów wejściowych i 25 dolarów za wyjściowe. To drastyczna obniżka względem poprzednika, który kosztował odpowiednio 15 i 75 dolarów.

    Dodatkowo, środowisko Claude Code, wcześniej dostępne głównie przez linię komend, trafiło natywnie do aplikacji desktopowych. Nowy interfejs pozwala na wygodne przełączanie się między tradycyjnym czatem a środowiskiem programistycznym w kartach. Deweloperzy otrzymali też nowy parametr „effort”, pozwalający precyzyjnie balansować między dokładnością modelu a zużyciem tokenów.

    Sojusz tytanów AI. Microsoft, Nvidia i Anthropic wchodzą w układ za 30 mld dolarów. Koniec przewagi OpenAI?

    #aiSi #anthropic #claude #gemini3 #gpt51 #news #opus45 #programowanie #sztucznaInteligencja

  18. 💡 Anthropic lancia Claude Opus 4.5 e tre nuove funzionalità per sviluppatori
    Il nuovo modello di Anthropic raggiunge l'80,9% su SWE-bench Verified e introduce tre funzionalità che riducono il consumo di token dell'85% per gli agenti IA

    gomoot.com/anthropic-lancia-cl

    #opus45

  19. 💡 Anthropic lancia Claude Opus 4.5 e tre nuove funzionalità per sviluppatori
    Il nuovo modello di Anthropic raggiunge l'80,9% su SWE-bench Verified e introduce tre funzionalità che riducono il consumo di token dell'85% per gli agenti IA

    gomoot.com/anthropic-lancia-cl

    #opus45

  20. 💡 Anthropic lancia Claude Opus 4.5 e tre nuove funzionalità per sviluppatori
    Il nuovo modello di Anthropic raggiunge l'80,9% su SWE-bench Verified e introduce tre funzionalità che riducono il consumo di token dell'85% per gli agenti IA

    gomoot.com/anthropic-lancia-cl

    #opus45

  21. 💡 Anthropic lancia Claude Opus 4.5 e tre nuove funzionalità per sviluppatori
    Il nuovo modello di Anthropic raggiunge l'80,9% su SWE-bench Verified e introduce tre funzionalità che riducono il consumo di token dell'85% per gli agenti IA

    gomoot.com/anthropic-lancia-cl

    #opus45

  22. #Anthropic released #Opus45, the latest version of its flagship model, featuring state-of-the-art performance on various benchmarks. The model boasts improved #computeruse and #spreadsheetcapabilities. Additionally, Opus 4.5 includes #memoryimprovements for #longcontext operations and an “#endlesschat” feature for paid users. techcrunch.com/2025/11/24/anth #tech #media #news

  23. #Anthropic released #Opus45, the latest version of its flagship model, featuring state-of-the-art performance on various benchmarks. The model boasts improved #computeruse and #spreadsheetcapabilities. Additionally, Opus 4.5 includes #memoryimprovements for #longcontext operations and an “#endlesschat” feature for paid users. techcrunch.com/2025/11/24/anth #tech #media #news

  24. #Anthropic released #Opus45, the latest version of its flagship model, featuring state-of-the-art performance on various benchmarks. The model boasts improved #computeruse and #spreadsheetcapabilities. Additionally, Opus 4.5 includes #memoryimprovements for #longcontext operations and an “#endlesschat” feature for paid users. techcrunch.com/2025/11/24/anth #tech #media #news

  25. #Anthropic released #Opus45, the latest version of its flagship model, featuring state-of-the-art performance on various benchmarks. The model boasts improved #computeruse and #spreadsheetcapabilities. Additionally, Opus 4.5 includes #memoryimprovements for #longcontext operations and an “#endlesschat” feature for paid users. techcrunch.com/2025/11/24/anth #tech #media #news

  26. #Anthropic released #Opus45, the latest version of its flagship model, featuring state-of-the-art performance on various benchmarks. The model boasts improved #computeruse and #spreadsheetcapabilities. Additionally, Opus 4.5 includes #memoryimprovements for #longcontext operations and an “#endlesschat” feature for paid users. techcrunch.com/2025/11/24/anth #tech #media #news