Sign in Create account

#gpt54 — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #gpt54, aggregated by home.social.

Gea-Suan Lin @[email protected] · 2026-05-08 · 11:55 UTC

https://blog.gslin.org/archives/2026/05/08/13032/openrouter-%e5%b0%8d-gpt-5-5-%e6%bc%b2%e5%83%b9%e7%9a%84%e5%88%86%e6%9e%90/
OpenRouter 對 GPT-5.5 漲價的分析
#analysis #cost #gpt #Gpt54 #Gpt55 #increase #language #large #llm #model #openai #openrouter #pricing #prompt #token

#analysis #cost #gpt #gpt54 #gpt55 #increase
Gea-Suan Lin @[email protected] · 2026-05-08 · 11:55 UTC

https://blog.gslin.org/archives/2026/05/08/13032/openrouter-%e5%b0%8d-gpt-5-5-%e6%bc%b2%e5%83%b9%e7%9a%84%e5%88%86%e6%9e%90/
OpenRouter 對 GPT-5.5 漲價的分析
#analysis #cost #gpt #Gpt54 #Gpt55 #increase #language #large #llm #model #openai #openrouter #pricing #prompt #token

#analysis #cost #gpt #gpt54 #gpt55 #increase
Gea-Suan Lin @[email protected] · 2026-05-08 · 11:55 UTC

https://blog.gslin.org/archives/2026/05/08/13032/openrouter-%e5%b0%8d-gpt-5-5-%e6%bc%b2%e5%83%b9%e7%9a%84%e5%88%86%e6%9e%90/
OpenRouter 對 GPT-5.5 漲價的分析
#analysis #cost #gpt #Gpt54 #Gpt55 #increase #language #large #llm #model #openai #openrouter #pricing #prompt #token

#analysis #cost #gpt #gpt54 #gpt55 #increase
Gea-Suan Lin @[email protected] · 2026-05-08 · 11:55 UTC

https://blog.gslin.org/archives/2026/05/08/13032/openrouter-%e5%b0%8d-gpt-5-5-%e6%bc%b2%e5%83%b9%e7%9a%84%e5%88%86%e6%9e%90/
OpenRouter 對 GPT-5.5 漲價的分析
#analysis #cost #gpt #Gpt54 #Gpt55 #increase #language #large #llm #model #openai #openrouter #pricing #prompt #token

#token #prompt #pricing #openrouter #openai #model
Gea-Suan Lin @[email protected] · 2026-05-08 · 11:55 UTC

https://blog.gslin.org/archives/2026/05/08/13032/openrouter-%e5%b0%8d-gpt-5-5-%e6%bc%b2%e5%83%b9%e7%9a%84%e5%88%86%e6%9e%90/
OpenRouter 對 GPT-5.5 漲價的分析
#analysis #cost #gpt #Gpt54 #Gpt55 #increase #language #large #llm #model #openai #openrouter #pricing #prompt #token

#analysis #cost #gpt #gpt54 #gpt55 #increase
Winbuzzer @[email protected] · 2026-05-02 · 11:52 UTC

https://winbuzzer.com/2026/05/02/google-deepmind-ai-co-clinician-beats-gpt-5-4-blind-doctor-tests-xcxwbn/
Google DeepMind AI Co-Clinician Tops GPT-5.4 in 98-Query Test But Still Trails Physicians
#AI #GPT54 #GoogleDeepMind #DeepMind #Google #OpenAI #AIModels #AIResearch #Healthtech #AIMedicine #Healthcare

#ai #gpt54 #googledeepmind #deepmind #google #openai
Winbuzzer @[email protected] · 2026-05-02 · 11:52 UTC

https://winbuzzer.com/2026/05/02/google-deepmind-ai-co-clinician-beats-gpt-5-4-blind-doctor-tests-xcxwbn/
Google DeepMind AI Co-Clinician Tops GPT-5.4 in 98-Query Test But Still Trails Physicians
#AI #GPT54 #GoogleDeepMind #DeepMind #Google #OpenAI #AIModels #AIResearch #Healthtech #AIMedicine #Healthcare

#ai #gpt54 #googledeepmind #deepmind #google #openai
Winbuzzer @[email protected] · 2026-05-02 · 11:52 UTC

https://winbuzzer.com/2026/05/02/google-deepmind-ai-co-clinician-beats-gpt-5-4-blind-doctor-tests-xcxwbn/
Google DeepMind AI Co-Clinician Tops GPT-5.4 in 98-Query Test But Still Trails Physicians
#AI #GPT54 #GoogleDeepMind #DeepMind #Google #OpenAI #AIModels #AIResearch #Healthtech #AIMedicine #Healthcare

#ai #gpt54 #googledeepmind #deepmind #google #openai
Winbuzzer @[email protected] · 2026-05-02 · 11:52 UTC

https://winbuzzer.com/2026/05/02/google-deepmind-ai-co-clinician-beats-gpt-5-4-blind-doctor-tests-xcxwbn/
Google DeepMind AI Co-Clinician Tops GPT-5.4 in 98-Query Test But Still Trails Physicians
#AI #GPT54 #GoogleDeepMind #DeepMind #Google #OpenAI #AIModels #AIResearch #Healthtech #AIMedicine #Healthcare

#healthcare #aimedicine #healthtech #airesearch #aimodels #openai
Winbuzzer @[email protected] · 2026-05-02 · 11:52 UTC

https://winbuzzer.com/2026/05/02/google-deepmind-ai-co-clinician-beats-gpt-5-4-blind-doctor-tests-xcxwbn/
Google DeepMind AI Co-Clinician Tops GPT-5.4 in 98-Query Test But Still Trails Physicians
#AI #GPT54 #GoogleDeepMind #DeepMind #Google #OpenAI #AIModels #AIResearch #Healthtech #AIMedicine #Healthcare

#ai #gpt54 #googledeepmind #deepmind #google #openai
Rod2ik 🇪🇺 🇨🇵 🇪🇸 🇨🇱 🇺🇦 🇨🇦 🇬🇱 ☮🕊️ @[email protected] · 2026-04-27 · 16:58 UTC

#Korben: Un amateur résout un #problème d' #Erdős vieux de 60 ans avec un seul #prompt #GPT-5.4 korben.info/un-amateur-r...

Un amateur résout un problème ...

#korben #probleme #erdos #prompt #gpt54
Rod2ik 🇪🇺 🇨🇵 🇪🇸 🇨🇱 🇺🇦 🇨🇦 🇬🇱 ☮🕊️ @[email protected] · 2026-04-27 · 16:58 UTC

#Korben: Un amateur résout un #problème d' #Erdős vieux de 60 ans avec un seul #prompt #GPT-5.4 korben.info/un-amateur-r...

Un amateur résout un problème ...

#gpt54 #prompt #erdos #probleme #korben
Tecnoblog • tecnologia que interessa [Unofficial] @[email protected] · 2026-04-24 · 16:08 UTC

OpenAI lança GPT-5.5 com foco em programação e autonomia

https://fed.brid.gy/r/https://tecnoblog.net/noticias/openai-lanca-gpt-5-5-com-foco-em-programacao-e-autonomia/

#inteligenciaartificial #chatgpt #gpt #gpt54 #openai
Slovensko @[email protected] · 2026-04-24 · 00:20 UTC

https://www.europesays.com/sk/52165/ OpenAI vydalo GPT 5.5 – Sector.sk #API #Business #ChatGPT #Codex #Economic #Ekonomika #GPT54 #GPT55 #OpenAi #PreparednessFramework #SK #Slovak #Slovakia #Slovenčina #Slovensko #TrustedAccessForCyber

#trustedaccessforcyber #slovensko #slovencina #slovakia #slovak #sk
Rod2ik 🇪🇺 🇨🇵 🇪🇸 🇨🇱 🇺🇦 🇨🇦 🇬🇱 ☮🕊️ @[email protected] · 2026-04-23 · 14:05 UTC

#Clubic: Un modèle #chinois coiffe #Claude et #GPT-5.4 au poteau sur le #codage, une bascule pour l' #IA #ouverte ? www.clubic.com/actualite-61...

Un modèle chinois coiffe Claud...

#clubic #chinois #claude #gpt54 #codage #ia
Rod2ik 🇪🇺 🇨🇵 🇪🇸 🇨🇱 🇺🇦 🇨🇦 🇬🇱 ☮🕊️ @[email protected] · 2026-04-23 · 14:05 UTC

#Clubic: Un modèle #chinois coiffe #Claude et #GPT-5.4 au poteau sur le #codage, une bascule pour l' #IA #ouverte ? www.clubic.com/actualite-61...

Un modèle chinois coiffe Claud...

#ouverte #ia #codage #gpt54 #claude #chinois
Agnieszka Serafinowicz @[email protected] · 2026-04-20 · 06:00 UTC

Nowy Claude ułatwi pracę programistom. Najciekawszy jest jednak model, którego Anthropic nie chce nam pokazać

Poniedziałkowy poranek przynosi dobre wieści dla świata IT. Anthropic właśnie zaprezentowało Claude Opus 4.7 – model skrojony pod zaawansowaną inżynierię oprogramowania.
I choć nowe narzędzie w wielu testach wyprzedza flagowe rozwiązania Google i OpenAI, prawdziwa dyskusja toczy się wokół czegoś zupełnie innego. Twórcy otwarcie przyznają, że mają w laboratoriach znacznie bardziej zaawansowany model. Problem w tym, że uznano go za zbyt ryzykowny, by obecnie ujrzał światło dzienne.
Kodowanie bez nadzoru i nowa ekonomia tokenów
Wraz z rosnącą popularnością tzw. „vibe codingu” (czyli tworzenia oprogramowania za pomocą naturalnych poleceń tekstowych, a nie tradycyjnego pisania kodu), Claude ugruntował swoją pozycję jako jedno z ulubionych narzędzi deweloperów. Wersja Opus 4.7 ma ten status przypieczętować.
Jak deklaruje Anthropic, nowy model radzi sobie z najtrudniejszymi zadaniami inżynieryjnymi, które do tej pory wymagały stałego nadzoru człowieka. Opus 4.7 potrafi obsługiwać złożone, długotrwałe procesy, zachowując spójność i samodzielnie weryfikując poprawność wygenerowanego kodu przed zwróceniem wyniku. Model zyskał również zauważalnie lepszą analizę obrazu oraz wyższy poziom kreatywności przy tworzeniu prezentacji i interfejsów. Jest jednak pewien haczyk – aktualizacja wprowadza nowy mechanizm podziału tekstu (tokenizer). Choć usprawnia on przetwarzanie danych, może prowadzić do większego zużycia tokenów, co w praktyce oznacza wyższe koszty dla użytkowników komercyjnych.
Claude łapie za myszkę. Sztuczna inteligencja od Anthropic potrafi już samodzielnie obsługiwać komputery Mac
Tajemnica projektu Mythos
Z opublikowanych wykresów wynika, że Opus 4.7 skutecznie rywalizuje, a w wielu aspektach pokonuje takie modele jak Gemini 3.1 Pro od Google czy GPT 5.4 od OpenAI. Dlaczego więc Anthropic w swoim własnym komunikacie niejako umniejsza jego możliwości?
Wszystko za sprawą modelu o nazwie Mythos. Firma przyznaje, że Opus 4.7 jest narzędziem znacznie mniej wszechstronnym. Mythos okazał się jednak wybitny w wykrywaniu i analizowaniu luk w zabezpieczeniach systemów informatycznych. Ta niesamowita skuteczność stanowi jednak miecz obosieczny – z tego powodu Anthropic podjęło decyzję o ograniczeniu jego dostępności i zamknięciu w laboratoriach. Wypuszczony właśnie na rynek Opus 4.7 posiada natomiast rygorystyczne blokady bezpieczeństwa, które automatycznie ucinają zapytania związane z omijaniem zabezpieczeń informatycznych.
Nowa era cyfrowych strażników
Ten z pozoru zwykły debiut oprogramowania pokazuje nam wyraźną zmianę na rynku sztucznej inteligencji. Przez ostatnie kilkanaście miesięcy trwał nieskrępowany wyścig o to, kto pokaże światu mądrzejszy algorytm. Dziś wchodzimy w erę, w której możliwości techniczne wyprzedziły procedury bezpieczeństwa.
Fakt, że Anthropic otwarcie chwali się modelem, którego nie zamierza wydać, dowodzi, że giganci technologiczni stają się nowymi cyfrowymi strażnikami. Po raz pierwszy to nie możliwości technologiczne wyznaczają tempo rozwoju AI, ale decyzje o tym, czego nie należy publikować. Opus 4.7 to bez wątpienia świetne usprawnienie codziennej pracy programistów, ale to zamknięty w laboratoriach Mythos wyznacza dziś prawdziwą granicę sztucznej inteligencji.
#AI #Anthropic #Claude #cyberbezpieczeństwo #Gemini31Pro #GPT54 #innowacjeIT #programowanie #sztucznaInteligencja #vibeCoding

#ai #anthropic #claude #cyberbezpieczenstwo #gemini31pro #gpt54
Agnieszka Serafinowicz @[email protected] · 2026-04-20 · 06:00 UTC

Nowy Claude ułatwi pracę programistom. Najciekawszy jest jednak model, którego Anthropic nie chce nam pokazać

Poniedziałkowy poranek przynosi dobre wieści dla świata IT. Anthropic właśnie zaprezentowało Claude Opus 4.7 – model skrojony pod zaawansowaną inżynierię oprogramowania.
I choć nowe narzędzie w wielu testach wyprzedza flagowe rozwiązania Google i OpenAI, prawdziwa dyskusja toczy się wokół czegoś zupełnie innego. Twórcy otwarcie przyznają, że mają w laboratoriach znacznie bardziej zaawansowany model. Problem w tym, że uznano go za zbyt ryzykowny, by obecnie ujrzał światło dzienne.
Kodowanie bez nadzoru i nowa ekonomia tokenów
Wraz z rosnącą popularnością tzw. „vibe codingu” (czyli tworzenia oprogramowania za pomocą naturalnych poleceń tekstowych, a nie tradycyjnego pisania kodu), Claude ugruntował swoją pozycję jako jedno z ulubionych narzędzi deweloperów. Wersja Opus 4.7 ma ten status przypieczętować.
Jak deklaruje Anthropic, nowy model radzi sobie z najtrudniejszymi zadaniami inżynieryjnymi, które do tej pory wymagały stałego nadzoru człowieka. Opus 4.7 potrafi obsługiwać złożone, długotrwałe procesy, zachowując spójność i samodzielnie weryfikując poprawność wygenerowanego kodu przed zwróceniem wyniku. Model zyskał również zauważalnie lepszą analizę obrazu oraz wyższy poziom kreatywności przy tworzeniu prezentacji i interfejsów. Jest jednak pewien haczyk – aktualizacja wprowadza nowy mechanizm podziału tekstu (tokenizer). Choć usprawnia on przetwarzanie danych, może prowadzić do większego zużycia tokenów, co w praktyce oznacza wyższe koszty dla użytkowników komercyjnych.
Claude łapie za myszkę. Sztuczna inteligencja od Anthropic potrafi już samodzielnie obsługiwać komputery Mac
Tajemnica projektu Mythos
Z opublikowanych wykresów wynika, że Opus 4.7 skutecznie rywalizuje, a w wielu aspektach pokonuje takie modele jak Gemini 3.1 Pro od Google czy GPT 5.4 od OpenAI. Dlaczego więc Anthropic w swoim własnym komunikacie niejako umniejsza jego możliwości?
Wszystko za sprawą modelu o nazwie Mythos. Firma przyznaje, że Opus 4.7 jest narzędziem znacznie mniej wszechstronnym. Mythos okazał się jednak wybitny w wykrywaniu i analizowaniu luk w zabezpieczeniach systemów informatycznych. Ta niesamowita skuteczność stanowi jednak miecz obosieczny – z tego powodu Anthropic podjęło decyzję o ograniczeniu jego dostępności i zamknięciu w laboratoriach. Wypuszczony właśnie na rynek Opus 4.7 posiada natomiast rygorystyczne blokady bezpieczeństwa, które automatycznie ucinają zapytania związane z omijaniem zabezpieczeń informatycznych.
Nowa era cyfrowych strażników
Ten z pozoru zwykły debiut oprogramowania pokazuje nam wyraźną zmianę na rynku sztucznej inteligencji. Przez ostatnie kilkanaście miesięcy trwał nieskrępowany wyścig o to, kto pokaże światu mądrzejszy algorytm. Dziś wchodzimy w erę, w której możliwości techniczne wyprzedziły procedury bezpieczeństwa.
Fakt, że Anthropic otwarcie chwali się modelem, którego nie zamierza wydać, dowodzi, że giganci technologiczni stają się nowymi cyfrowymi strażnikami. Po raz pierwszy to nie możliwości technologiczne wyznaczają tempo rozwoju AI, ale decyzje o tym, czego nie należy publikować. Opus 4.7 to bez wątpienia świetne usprawnienie codziennej pracy programistów, ale to zamknięty w laboratoriach Mythos wyznacza dziś prawdziwą granicę sztucznej inteligencji.
#AI #Anthropic #Claude #cyberbezpieczeństwo #Gemini31Pro #GPT54 #innowacjeIT #programowanie #sztucznaInteligencja #vibeCoding

#ai #anthropic #claude #cyberbezpieczenstwo #gemini31pro #gpt54
Agnieszka Serafinowicz @[email protected] · 2026-04-20 · 06:00 UTC

Nowy Claude ułatwi pracę programistom. Najciekawszy jest jednak model, którego Anthropic nie chce nam pokazać

Poniedziałkowy poranek przynosi dobre wieści dla świata IT. Anthropic właśnie zaprezentowało Claude Opus 4.7 – model skrojony pod zaawansowaną inżynierię oprogramowania.
I choć nowe narzędzie w wielu testach wyprzedza flagowe rozwiązania Google i OpenAI, prawdziwa dyskusja toczy się wokół czegoś zupełnie innego. Twórcy otwarcie przyznają, że mają w laboratoriach znacznie bardziej zaawansowany model. Problem w tym, że uznano go za zbyt ryzykowny, by obecnie ujrzał światło dzienne.
Kodowanie bez nadzoru i nowa ekonomia tokenów
Wraz z rosnącą popularnością tzw. „vibe codingu” (czyli tworzenia oprogramowania za pomocą naturalnych poleceń tekstowych, a nie tradycyjnego pisania kodu), Claude ugruntował swoją pozycję jako jedno z ulubionych narzędzi deweloperów. Wersja Opus 4.7 ma ten status przypieczętować.
Jak deklaruje Anthropic, nowy model radzi sobie z najtrudniejszymi zadaniami inżynieryjnymi, które do tej pory wymagały stałego nadzoru człowieka. Opus 4.7 potrafi obsługiwać złożone, długotrwałe procesy, zachowując spójność i samodzielnie weryfikując poprawność wygenerowanego kodu przed zwróceniem wyniku. Model zyskał również zauważalnie lepszą analizę obrazu oraz wyższy poziom kreatywności przy tworzeniu prezentacji i interfejsów. Jest jednak pewien haczyk – aktualizacja wprowadza nowy mechanizm podziału tekstu (tokenizer). Choć usprawnia on przetwarzanie danych, może prowadzić do większego zużycia tokenów, co w praktyce oznacza wyższe koszty dla użytkowników komercyjnych.
Claude łapie za myszkę. Sztuczna inteligencja od Anthropic potrafi już samodzielnie obsługiwać komputery Mac
Tajemnica projektu Mythos
Z opublikowanych wykresów wynika, że Opus 4.7 skutecznie rywalizuje, a w wielu aspektach pokonuje takie modele jak Gemini 3.1 Pro od Google czy GPT 5.4 od OpenAI. Dlaczego więc Anthropic w swoim własnym komunikacie niejako umniejsza jego możliwości?
Wszystko za sprawą modelu o nazwie Mythos. Firma przyznaje, że Opus 4.7 jest narzędziem znacznie mniej wszechstronnym. Mythos okazał się jednak wybitny w wykrywaniu i analizowaniu luk w zabezpieczeniach systemów informatycznych. Ta niesamowita skuteczność stanowi jednak miecz obosieczny – z tego powodu Anthropic podjęło decyzję o ograniczeniu jego dostępności i zamknięciu w laboratoriach. Wypuszczony właśnie na rynek Opus 4.7 posiada natomiast rygorystyczne blokady bezpieczeństwa, które automatycznie ucinają zapytania związane z omijaniem zabezpieczeń informatycznych.
Nowa era cyfrowych strażników
Ten z pozoru zwykły debiut oprogramowania pokazuje nam wyraźną zmianę na rynku sztucznej inteligencji. Przez ostatnie kilkanaście miesięcy trwał nieskrępowany wyścig o to, kto pokaże światu mądrzejszy algorytm. Dziś wchodzimy w erę, w której możliwości techniczne wyprzedziły procedury bezpieczeństwa.
Fakt, że Anthropic otwarcie chwali się modelem, którego nie zamierza wydać, dowodzi, że giganci technologiczni stają się nowymi cyfrowymi strażnikami. Po raz pierwszy to nie możliwości technologiczne wyznaczają tempo rozwoju AI, ale decyzje o tym, czego nie należy publikować. Opus 4.7 to bez wątpienia świetne usprawnienie codziennej pracy programistów, ale to zamknięty w laboratoriach Mythos wyznacza dziś prawdziwą granicę sztucznej inteligencji.
#AI #Anthropic #Claude #cyberbezpieczeństwo #Gemini31Pro #GPT54 #innowacjeIT #programowanie #sztucznaInteligencja #vibeCoding

#ai #anthropic #claude #cyberbezpieczenstwo #gemini31pro #gpt54
Agnieszka Serafinowicz @[email protected] · 2026-04-20 · 06:00 UTC

Nowy Claude ułatwi pracę programistom. Najciekawszy jest jednak model, którego Anthropic nie chce nam pokazać

Poniedziałkowy poranek przynosi dobre wieści dla świata IT. Anthropic właśnie zaprezentowało Claude Opus 4.7 – model skrojony pod zaawansowaną inżynierię oprogramowania.
I choć nowe narzędzie w wielu testach wyprzedza flagowe rozwiązania Google i OpenAI, prawdziwa dyskusja toczy się wokół czegoś zupełnie innego. Twórcy otwarcie przyznają, że mają w laboratoriach znacznie bardziej zaawansowany model. Problem w tym, że uznano go za zbyt ryzykowny, by obecnie ujrzał światło dzienne.
Kodowanie bez nadzoru i nowa ekonomia tokenów
Wraz z rosnącą popularnością tzw. „vibe codingu” (czyli tworzenia oprogramowania za pomocą naturalnych poleceń tekstowych, a nie tradycyjnego pisania kodu), Claude ugruntował swoją pozycję jako jedno z ulubionych narzędzi deweloperów. Wersja Opus 4.7 ma ten status przypieczętować.
Jak deklaruje Anthropic, nowy model radzi sobie z najtrudniejszymi zadaniami inżynieryjnymi, które do tej pory wymagały stałego nadzoru człowieka. Opus 4.7 potrafi obsługiwać złożone, długotrwałe procesy, zachowując spójność i samodzielnie weryfikując poprawność wygenerowanego kodu przed zwróceniem wyniku. Model zyskał również zauważalnie lepszą analizę obrazu oraz wyższy poziom kreatywności przy tworzeniu prezentacji i interfejsów. Jest jednak pewien haczyk – aktualizacja wprowadza nowy mechanizm podziału tekstu (tokenizer). Choć usprawnia on przetwarzanie danych, może prowadzić do większego zużycia tokenów, co w praktyce oznacza wyższe koszty dla użytkowników komercyjnych.
Claude łapie za myszkę. Sztuczna inteligencja od Anthropic potrafi już samodzielnie obsługiwać komputery Mac
Tajemnica projektu Mythos
Z opublikowanych wykresów wynika, że Opus 4.7 skutecznie rywalizuje, a w wielu aspektach pokonuje takie modele jak Gemini 3.1 Pro od Google czy GPT 5.4 od OpenAI. Dlaczego więc Anthropic w swoim własnym komunikacie niejako umniejsza jego możliwości?
Wszystko za sprawą modelu o nazwie Mythos. Firma przyznaje, że Opus 4.7 jest narzędziem znacznie mniej wszechstronnym. Mythos okazał się jednak wybitny w wykrywaniu i analizowaniu luk w zabezpieczeniach systemów informatycznych. Ta niesamowita skuteczność stanowi jednak miecz obosieczny – z tego powodu Anthropic podjęło decyzję o ograniczeniu jego dostępności i zamknięciu w laboratoriach. Wypuszczony właśnie na rynek Opus 4.7 posiada natomiast rygorystyczne blokady bezpieczeństwa, które automatycznie ucinają zapytania związane z omijaniem zabezpieczeń informatycznych.
Nowa era cyfrowych strażników
Ten z pozoru zwykły debiut oprogramowania pokazuje nam wyraźną zmianę na rynku sztucznej inteligencji. Przez ostatnie kilkanaście miesięcy trwał nieskrępowany wyścig o to, kto pokaże światu mądrzejszy algorytm. Dziś wchodzimy w erę, w której możliwości techniczne wyprzedziły procedury bezpieczeństwa.
Fakt, że Anthropic otwarcie chwali się modelem, którego nie zamierza wydać, dowodzi, że giganci technologiczni stają się nowymi cyfrowymi strażnikami. Po raz pierwszy to nie możliwości technologiczne wyznaczają tempo rozwoju AI, ale decyzje o tym, czego nie należy publikować. Opus 4.7 to bez wątpienia świetne usprawnienie codziennej pracy programistów, ale to zamknięty w laboratoriach Mythos wyznacza dziś prawdziwą granicę sztucznej inteligencji.
#AI #Anthropic #Claude #cyberbezpieczeństwo #Gemini31Pro #GPT54 #innowacjeIT #programowanie #sztucznaInteligencja #vibeCoding

#vibecoding #sztucznainteligencja #programowanie #innowacjeit #gpt54 #gemini31pro
Agnieszka Serafinowicz @[email protected] · 2026-04-20 · 06:00 UTC

Nowy Claude ułatwi pracę programistom. Najciekawszy jest jednak model, którego Anthropic nie chce nam pokazać

Poniedziałkowy poranek przynosi dobre wieści dla świata IT. Anthropic właśnie zaprezentowało Claude Opus 4.7 – model skrojony pod zaawansowaną inżynierię oprogramowania.
I choć nowe narzędzie w wielu testach wyprzedza flagowe rozwiązania Google i OpenAI, prawdziwa dyskusja toczy się wokół czegoś zupełnie innego. Twórcy otwarcie przyznają, że mają w laboratoriach znacznie bardziej zaawansowany model. Problem w tym, że uznano go za zbyt ryzykowny, by obecnie ujrzał światło dzienne.
Kodowanie bez nadzoru i nowa ekonomia tokenów
Wraz z rosnącą popularnością tzw. „vibe codingu” (czyli tworzenia oprogramowania za pomocą naturalnych poleceń tekstowych, a nie tradycyjnego pisania kodu), Claude ugruntował swoją pozycję jako jedno z ulubionych narzędzi deweloperów. Wersja Opus 4.7 ma ten status przypieczętować.
Jak deklaruje Anthropic, nowy model radzi sobie z najtrudniejszymi zadaniami inżynieryjnymi, które do tej pory wymagały stałego nadzoru człowieka. Opus 4.7 potrafi obsługiwać złożone, długotrwałe procesy, zachowując spójność i samodzielnie weryfikując poprawność wygenerowanego kodu przed zwróceniem wyniku. Model zyskał również zauważalnie lepszą analizę obrazu oraz wyższy poziom kreatywności przy tworzeniu prezentacji i interfejsów. Jest jednak pewien haczyk – aktualizacja wprowadza nowy mechanizm podziału tekstu (tokenizer). Choć usprawnia on przetwarzanie danych, może prowadzić do większego zużycia tokenów, co w praktyce oznacza wyższe koszty dla użytkowników komercyjnych.
Claude łapie za myszkę. Sztuczna inteligencja od Anthropic potrafi już samodzielnie obsługiwać komputery Mac
Tajemnica projektu Mythos
Z opublikowanych wykresów wynika, że Opus 4.7 skutecznie rywalizuje, a w wielu aspektach pokonuje takie modele jak Gemini 3.1 Pro od Google czy GPT 5.4 od OpenAI. Dlaczego więc Anthropic w swoim własnym komunikacie niejako umniejsza jego możliwości?
Wszystko za sprawą modelu o nazwie Mythos. Firma przyznaje, że Opus 4.7 jest narzędziem znacznie mniej wszechstronnym. Mythos okazał się jednak wybitny w wykrywaniu i analizowaniu luk w zabezpieczeniach systemów informatycznych. Ta niesamowita skuteczność stanowi jednak miecz obosieczny – z tego powodu Anthropic podjęło decyzję o ograniczeniu jego dostępności i zamknięciu w laboratoriach. Wypuszczony właśnie na rynek Opus 4.7 posiada natomiast rygorystyczne blokady bezpieczeństwa, które automatycznie ucinają zapytania związane z omijaniem zabezpieczeń informatycznych.
Nowa era cyfrowych strażników
Ten z pozoru zwykły debiut oprogramowania pokazuje nam wyraźną zmianę na rynku sztucznej inteligencji. Przez ostatnie kilkanaście miesięcy trwał nieskrępowany wyścig o to, kto pokaże światu mądrzejszy algorytm. Dziś wchodzimy w erę, w której możliwości techniczne wyprzedziły procedury bezpieczeństwa.
Fakt, że Anthropic otwarcie chwali się modelem, którego nie zamierza wydać, dowodzi, że giganci technologiczni stają się nowymi cyfrowymi strażnikami. Po raz pierwszy to nie możliwości technologiczne wyznaczają tempo rozwoju AI, ale decyzje o tym, czego nie należy publikować. Opus 4.7 to bez wątpienia świetne usprawnienie codziennej pracy programistów, ale to zamknięty w laboratoriach Mythos wyznacza dziś prawdziwą granicę sztucznej inteligencji.
#AI #Anthropic #Claude #cyberbezpieczeństwo #Gemini31Pro #GPT54 #innowacjeIT #programowanie #sztucznaInteligencja #vibeCoding

#ai #anthropic #claude #cyberbezpieczenstwo #gemini31pro #gpt54
TechGlimmer @[email protected] · 2026-04-16 · 01:41 UTC

GPT-5.4 Cyber is a more permissive, defender focused model from OpenAI, designed to help security teams with vulnerability research, malware analysis, and binary reverse engineering instead of blocking every dual use query.
It’s a strong signal that AI is becoming part of the standard defensive toolkit, not just an attacker’s toy.
#GPT54 #CyberSecurity #InfoSec #BlueTeam #OpenAI

#gpt54 #cybersecurity #infosec #blueteam #openai
TechGlimmer @[email protected] · 2026-04-16 · 01:41 UTC

GPT-5.4 Cyber is a more permissive, defender focused model from OpenAI, designed to help security teams with vulnerability research, malware analysis, and binary reverse engineering instead of blocking every dual use query.
It’s a strong signal that AI is becoming part of the standard defensive toolkit, not just an attacker’s toy.
#GPT54 #CyberSecurity #InfoSec #BlueTeam #OpenAI

#gpt54 #cybersecurity #infosec #blueteam #openai
TechGlimmer @[email protected] · 2026-04-16 · 01:41 UTC

GPT-5.4 Cyber is a more permissive, defender focused model from OpenAI, designed to help security teams with vulnerability research, malware analysis, and binary reverse engineering instead of blocking every dual use query.
It’s a strong signal that AI is becoming part of the standard defensive toolkit, not just an attacker’s toy.
#GPT54 #CyberSecurity #InfoSec #BlueTeam #OpenAI

#gpt54 #cybersecurity #infosec #blueteam #openai
TechGlimmer @[email protected] · 2026-04-16 · 01:41 UTC

GPT-5.4 Cyber is a more permissive, defender focused model from OpenAI, designed to help security teams with vulnerability research, malware analysis, and binary reverse engineering instead of blocking every dual use query.
It’s a strong signal that AI is becoming part of the standard defensive toolkit, not just an attacker’s toy.
#GPT54 #CyberSecurity #InfoSec #BlueTeam #OpenAI

#openai #blueteam #infosec #cybersecurity #gpt54
TechGlimmer @[email protected] · 2026-04-16 · 01:41 UTC

GPT-5.4 Cyber is a more permissive, defender focused model from OpenAI, designed to help security teams with vulnerability research, malware analysis, and binary reverse engineering instead of blocking every dual use query.
It’s a strong signal that AI is becoming part of the standard defensive toolkit, not just an attacker’s toy.
#GPT54 #CyberSecurity #InfoSec #BlueTeam #OpenAI

#gpt54 #cybersecurity #infosec #blueteam #openai
TechGlimmer @[email protected] · 2026-04-16 · 01:32 UTC

OpenAI’s GPT-5.4 Cyber is a defender-first model with fewer restrictions, serious binary reverse-engineering skills, and access gated through its Trusted Access for Cyber program; aimed at getting more capable tools into the hands of vetted security teams. I also look at how it contrasts with Anthropic’s tightly curated Claude Mythos Preview and why this signals the start of true AI-assisted cyber defense:
https://techglimmer.io/what-is-gpt-5-4-and-gpt-5-4-review/
#GPT54 #CyberSecurity #InfoSec #AI #OpenAI #Anthropic

#gpt54 #cybersecurity #infosec #ai #openai #anthropic
TechGlimmer @[email protected] · 2026-04-16 · 01:32 UTC

OpenAI’s GPT-5.4 Cyber is a defender-first model with fewer restrictions, serious binary reverse-engineering skills, and access gated through its Trusted Access for Cyber program; aimed at getting more capable tools into the hands of vetted security teams. I also look at how it contrasts with Anthropic’s tightly curated Claude Mythos Preview and why this signals the start of true AI-assisted cyber defense:
https://techglimmer.io/what-is-gpt-5-4-and-gpt-5-4-review/
#GPT54 #CyberSecurity #InfoSec #AI #OpenAI #Anthropic

#gpt54 #cybersecurity #infosec #ai #openai #anthropic
TechGlimmer @[email protected] · 2026-04-16 · 01:32 UTC

OpenAI’s GPT-5.4 Cyber is a defender-first model with fewer restrictions, serious binary reverse-engineering skills, and access gated through its Trusted Access for Cyber program; aimed at getting more capable tools into the hands of vetted security teams. I also look at how it contrasts with Anthropic’s tightly curated Claude Mythos Preview and why this signals the start of true AI-assisted cyber defense:
https://techglimmer.io/what-is-gpt-5-4-and-gpt-5-4-review/
#GPT54 #CyberSecurity #InfoSec #AI #OpenAI #Anthropic

#gpt54 #cybersecurity #infosec #ai #openai #anthropic
TechGlimmer @[email protected] · 2026-04-16 · 01:32 UTC

OpenAI’s GPT-5.4 Cyber is a defender-first model with fewer restrictions, serious binary reverse-engineering skills, and access gated through its Trusted Access for Cyber program; aimed at getting more capable tools into the hands of vetted security teams. I also look at how it contrasts with Anthropic’s tightly curated Claude Mythos Preview and why this signals the start of true AI-assisted cyber defense:
https://techglimmer.io/what-is-gpt-5-4-and-gpt-5-4-review/
#GPT54 #CyberSecurity #InfoSec #AI #OpenAI #Anthropic

#anthropic #openai #ai #infosec #cybersecurity #gpt54
TechGlimmer @[email protected] · 2026-04-16 · 01:32 UTC

OpenAI’s GPT-5.4 Cyber is a defender-first model with fewer restrictions, serious binary reverse-engineering skills, and access gated through its Trusted Access for Cyber program; aimed at getting more capable tools into the hands of vetted security teams. I also look at how it contrasts with Anthropic’s tightly curated Claude Mythos Preview and why this signals the start of true AI-assisted cyber defense:
https://techglimmer.io/what-is-gpt-5-4-and-gpt-5-4-review/
#GPT54 #CyberSecurity #InfoSec #AI #OpenAI #Anthropic

#gpt54 #cybersecurity #infosec #ai #openai #anthropic
Tehisaru @[email protected] · 2026-04-15 · 07:11 UTC

OpenAI GPT-5.4-Cyber vs Anthropic Mythos https://tehisarukas.ee/openai-gpt-5-4-cyber/?utm_source=dlvr.it&utm_medium=mastodon #OpenAI #GPT54 #Anthropic #küberturvalisus #AIrevolutsioon

#openai #gpt54 #anthropic #kuberturvalisus #airevolutsioon
Tehisaru @[email protected] · 2026-04-15 · 07:11 UTC

OpenAI GPT-5.4-Cyber vs Anthropic Mythos https://tehisarukas.ee/openai-gpt-5-4-cyber/?utm_source=dlvr.it&utm_medium=mastodon #OpenAI #GPT54 #Anthropic #küberturvalisus #AIrevolutsioon

#openai #gpt54 #anthropic #kuberturvalisus #airevolutsioon
Tehisaru @[email protected] · 2026-04-15 · 07:11 UTC

OpenAI GPT-5.4-Cyber vs Anthropic Mythos https://tehisarukas.ee/openai-gpt-5-4-cyber/?utm_source=dlvr.it&utm_medium=mastodon #OpenAI #GPT54 #Anthropic #küberturvalisus #AIrevolutsioon

#openai #gpt54 #anthropic #kuberturvalisus #airevolutsioon
Tehisaru @[email protected] · 2026-04-15 · 07:11 UTC

OpenAI GPT-5.4-Cyber vs Anthropic Mythos https://tehisarukas.ee/openai-gpt-5-4-cyber/?utm_source=dlvr.it&utm_medium=mastodon #OpenAI #GPT54 #Anthropic #küberturvalisus #AIrevolutsioon

#airevolutsioon #kuberturvalisus #anthropic #gpt54 #openai
Brandon H :csharp: :verified: @[email protected] · 2026-04-10 · 16:36 UTC

via #AIFoundry : What’s new in Microsoft Foundry | March 2026
https://ift.tt/aPAbMB4
#MicrosoftFoundry #WhatsNew #March2026 #FoundryAgentService #GPT54 #GPT54Pro #GPT54Mini #Phi4ReasoningVision #Grok42 #FireworksAI #NVIDIANemotron #OSSModels #OpenSource #HostedAgents #Regions…

#aifoundry #microsoftfoundry #whatsnew #march2026 #foundryagentservice #gpt54
Brandon H :csharp: :verified: @[email protected] · 2026-04-10 · 16:36 UTC

via #AIFoundry : What’s new in Microsoft Foundry | March 2026
https://ift.tt/aPAbMB4
#MicrosoftFoundry #WhatsNew #March2026 #FoundryAgentService #GPT54 #GPT54Pro #GPT54Mini #Phi4ReasoningVision #Grok42 #FireworksAI #NVIDIANemotron #OSSModels #OpenSource #HostedAgents #Regions…

#aifoundry #microsoftfoundry #whatsnew #march2026 #foundryagentservice #gpt54
Brandon H :csharp: :verified: @bc3tech · 2026-04-10 · 16:36 UTC

via #AIFoundry : What’s new in Microsoft Foundry | March 2026
https://ift.tt/aPAbMB4
#MicrosoftFoundry #WhatsNew #March2026 #FoundryAgentService #GPT54 #GPT54Pro #GPT54Mini #Phi4ReasoningVision #Grok42 #FireworksAI #NVIDIANemotron #OSSModels #OpenSource #HostedAgents #Regions…

#aifoundry #microsoftfoundry #whatsnew #march2026 #foundryagentservice #gpt54
Brandon H :csharp: :verified: @[email protected] · 2026-04-10 · 16:36 UTC

via #AIFoundry : What’s new in Microsoft Foundry | March 2026
https://ift.tt/aPAbMB4
#MicrosoftFoundry #WhatsNew #March2026 #FoundryAgentService #GPT54 #GPT54Pro #GPT54Mini #Phi4ReasoningVision #Grok42 #FireworksAI #NVIDIANemotron #OSSModels #OpenSource #HostedAgents #Regions…

#regions #hostedagents #opensource #ossmodels #nvidianemotron #fireworksai
Brandon H :csharp: :verified: @[email protected] · 2026-04-10 · 16:36 UTC

via #AIFoundry : What’s new in Microsoft Foundry | March 2026
https://ift.tt/aPAbMB4
#MicrosoftFoundry #WhatsNew #March2026 #FoundryAgentService #GPT54 #GPT54Pro #GPT54Mini #Phi4ReasoningVision #Grok42 #FireworksAI #NVIDIANemotron #OSSModels #OpenSource #HostedAgents #Regions…

#aifoundry #microsoftfoundry #whatsnew #march2026 #foundryagentservice #gpt54
Habr @[email protected] · 2026-04-09 · 19:02 UTC

Как я превратил Codex в персонального Джарвиса
Можно ли превратить coding agent не просто в помощника по коду, а в персонального ассистента с долговременной памятью? Я собрал для Codex иерархическую базу знаний на Markdown и Git, добавил роли, автоматизации, AnkiConnect и Telegram-архивы, а затем проверил, насколько далеко можно зайти без векторных баз и сложного RAG. В статье показываю, как устроена такая система, где она реально полезна и почему главный вопрос здесь не в модели, а в архитектуре памяти.
https://habr.com/ru/articles/1021560/
#ai #codex #gpt #gpt54 #jarvis #llmагент

#llmагент #jarvis #gpt54 #gpt #codex #ai
Habr @[email protected] · 2026-04-09 · 19:02 UTC

Как я превратил Codex в персонального Джарвиса
Можно ли превратить coding agent не просто в помощника по коду, а в персонального ассистента с долговременной памятью? Я собрал для Codex иерархическую базу знаний на Markdown и Git, добавил роли, автоматизации, AnkiConnect и Telegram-архивы, а затем проверил, насколько далеко можно зайти без векторных баз и сложного RAG. В статье показываю, как устроена такая система, где она реально полезна и почему главный вопрос здесь не в модели, а в архитектуре памяти.
https://habr.com/ru/articles/1021560/
#ai #codex #gpt #gpt54 #jarvis #llmагент

#llmагент #jarvis #gpt54 #gpt #codex #ai
Habr @[email protected] · 2026-04-09 · 19:02 UTC

Как я превратил Codex в персонального Джарвиса
Можно ли превратить coding agent не просто в помощника по коду, а в персонального ассистента с долговременной памятью? Я собрал для Codex иерархическую базу знаний на Markdown и Git, добавил роли, автоматизации, AnkiConnect и Telegram-архивы, а затем проверил, насколько далеко можно зайти без векторных баз и сложного RAG. В статье показываю, как устроена такая система, где она реально полезна и почему главный вопрос здесь не в модели, а в архитектуре памяти.
https://habr.com/ru/articles/1021560/
#ai #codex #gpt #gpt54 #jarvis #llmагент

#llmагент #jarvis #gpt54 #gpt #codex #ai
Habr @[email protected] · 2026-04-09 · 19:02 UTC

Как я превратил Codex в персонального Джарвиса
Можно ли превратить coding agent не просто в помощника по коду, а в персонального ассистента с долговременной памятью? Я собрал для Codex иерархическую базу знаний на Markdown и Git, добавил роли, автоматизации, AnkiConnect и Telegram-архивы, а затем проверил, насколько далеко можно зайти без векторных баз и сложного RAG. В статье показываю, как устроена такая система, где она реально полезна и почему главный вопрос здесь не в модели, а в архитектуре памяти.
https://habr.com/ru/articles/1021560/
#ai #codex #gpt #gpt54 #jarvis #llmагент

#ai #codex #gpt #gpt54 #jarvis #llmагент
Habr @[email protected] · 2026-04-06 · 15:32 UTC

Иллюзия логики: как я доказал, что LLM-агенты игнорируют факты, и почему Chain-of-Thought делает только хуже
Сейчас каждый второй стартап пилит ИИ-агентов. Мы оборачиваем LLM в цикл Промпт -> Вызов инструмента -> Ответ и ждем, что нейросеть сама расследует инцидент, найдет баг или напишет фичу. Но на практике автономные агенты часто ходят по кругу, игнорируют явные ошибки и «влюбляются» в свою первую догадку. Индустрия пытается лечить это костылями: наращивает контекст до миллионов токенов или заставляет модель «подумать шаг за шагом» (Chain-of-Thought). Я решил проверить эту архитектуру на прочность. Собрал локальный измерительный стенд LOCK-R, вооружился Теоремой Байеса и поймал современные LLM за руку. В этой статье я математически докажу, почему одиночные агенты структурно уязвимы, как токены размышлений заставляют их врать самим себе еще искуснее, и почему паттерн «Слепого Судьи» - это единственный способ вылечить AI от предвзятости. Тестируем на локальной Qwen-9B и фронтирной GPT-5.4.
https://habr.com/ru/articles/1020016/
#llm #ai_agents #rag #machine_learning #архитектура #chainofthought #теорема_байеса #gpt54 #qwen35 #бенчмарк

#бенчмарк #qwen35 #gpt54 #теорема_байеса #chainofthought #архитектура
Habr @[email protected] · 2026-04-06 · 15:32 UTC

Иллюзия логики: как я доказал, что LLM-агенты игнорируют факты, и почему Chain-of-Thought делает только хуже
Сейчас каждый второй стартап пилит ИИ-агентов. Мы оборачиваем LLM в цикл Промпт -> Вызов инструмента -> Ответ и ждем, что нейросеть сама расследует инцидент, найдет баг или напишет фичу. Но на практике автономные агенты часто ходят по кругу, игнорируют явные ошибки и «влюбляются» в свою первую догадку. Индустрия пытается лечить это костылями: наращивает контекст до миллионов токенов или заставляет модель «подумать шаг за шагом» (Chain-of-Thought). Я решил проверить эту архитектуру на прочность. Собрал локальный измерительный стенд LOCK-R, вооружился Теоремой Байеса и поймал современные LLM за руку. В этой статье я математически докажу, почему одиночные агенты структурно уязвимы, как токены размышлений заставляют их врать самим себе еще искуснее, и почему паттерн «Слепого Судьи» - это единственный способ вылечить AI от предвзятости. Тестируем на локальной Qwen-9B и фронтирной GPT-5.4.
https://habr.com/ru/articles/1020016/
#llm #ai_agents #rag #machine_learning #архитектура #chainofthought #теорема_байеса #gpt54 #qwen35 #бенчмарк

#бенчмарк #qwen35 #gpt54 #теорема_байеса #chainofthought #архитектура
Habr @[email protected] · 2026-04-06 · 15:32 UTC

Иллюзия логики: как я доказал, что LLM-агенты игнорируют факты, и почему Chain-of-Thought делает только хуже
Сейчас каждый второй стартап пилит ИИ-агентов. Мы оборачиваем LLM в цикл Промпт -> Вызов инструмента -> Ответ и ждем, что нейросеть сама расследует инцидент, найдет баг или напишет фичу. Но на практике автономные агенты часто ходят по кругу, игнорируют явные ошибки и «влюбляются» в свою первую догадку. Индустрия пытается лечить это костылями: наращивает контекст до миллионов токенов или заставляет модель «подумать шаг за шагом» (Chain-of-Thought). Я решил проверить эту архитектуру на прочность. Собрал локальный измерительный стенд LOCK-R, вооружился Теоремой Байеса и поймал современные LLM за руку. В этой статье я математически докажу, почему одиночные агенты структурно уязвимы, как токены размышлений заставляют их врать самим себе еще искуснее, и почему паттерн «Слепого Судьи» - это единственный способ вылечить AI от предвзятости. Тестируем на локальной Qwen-9B и фронтирной GPT-5.4.
https://habr.com/ru/articles/1020016/
#llm #ai_agents #rag #machine_learning #архитектура #chainofthought #теорема_байеса #gpt54 #qwen35 #бенчмарк

#бенчмарк #qwen35 #gpt54 #теорема_байеса #chainofthought #архитектура
Habr @[email protected] · 2026-04-06 · 15:32 UTC

Иллюзия логики: как я доказал, что LLM-агенты игнорируют факты, и почему Chain-of-Thought делает только хуже
Сейчас каждый второй стартап пилит ИИ-агентов. Мы оборачиваем LLM в цикл Промпт -> Вызов инструмента -> Ответ и ждем, что нейросеть сама расследует инцидент, найдет баг или напишет фичу. Но на практике автономные агенты часто ходят по кругу, игнорируют явные ошибки и «влюбляются» в свою первую догадку. Индустрия пытается лечить это костылями: наращивает контекст до миллионов токенов или заставляет модель «подумать шаг за шагом» (Chain-of-Thought). Я решил проверить эту архитектуру на прочность. Собрал локальный измерительный стенд LOCK-R, вооружился Теоремой Байеса и поймал современные LLM за руку. В этой статье я математически докажу, почему одиночные агенты структурно уязвимы, как токены размышлений заставляют их врать самим себе еще искуснее, и почему паттерн «Слепого Судьи» - это единственный способ вылечить AI от предвзятости. Тестируем на локальной Qwen-9B и фронтирной GPT-5.4.
https://habr.com/ru/articles/1020016/
#llm #ai_agents #rag #machine_learning #архитектура #chainofthought #теорема_байеса #gpt54 #qwen35 #бенчмарк

#llm #ai_agents #rag #machine_learning #архитектура #chainofthought
Habr @[email protected] · 2026-03-31 · 12:22 UTC

Люди набирают 100%, GPT-5.4 — 0,26%, а Google хватило всего лишь 3-бит
Седьмой выпуск еженедельных IT-новостей от OpenIDE: новый бенчмарк AGI, которому модели не смогли угодить, трёхбитная квантизация от Google, ACP-протокол в OpenIDE, GigaChat 3.1 и бесславный конец Sora.
https://habr.com/ru/companies/haulmont/articles/1017460/
#ARCAGI #GPT54 #Grok #Google_TurboQuant #OpenIDE_ACP #Claude_Capybara #Sora #GigaChat_31 #бенчмарк_AGI

#бенчмарк_agi #gigachat_31 #sora #claude_capybara #openide_acp #google_turboquant
Habr @[email protected] · 2026-03-31 · 12:22 UTC

Люди набирают 100%, GPT-5.4 — 0,26%, а Google хватило всего лишь 3-бит
Седьмой выпуск еженедельных IT-новостей от OpenIDE: новый бенчмарк AGI, которому модели не смогли угодить, трёхбитная квантизация от Google, ACP-протокол в OpenIDE, GigaChat 3.1 и бесславный конец Sora.
https://habr.com/ru/companies/haulmont/articles/1017460/
#ARCAGI #GPT54 #Grok #Google_TurboQuant #OpenIDE_ACP #Claude_Capybara #Sora #GigaChat_31 #бенчмарк_AGI

#бенчмарк_agi #gigachat_31 #sora #claude_capybara #openide_acp #google_turboquant