#arcagi2 — Public Fediverse posts on home.social

Habr @[email protected] · 2026-02-24 · 14:02 UTC

Как читать новости об ИИ и отличать прорыв от пресс-релиза. И как относиться к заголовкам про «ИИ отнимет работу»

Новости об ИИ выходят быстрее, чем успеваешь их переварить: релизы моделей, таблицы бенчмарков, заявления про "революцию" и "конец профессий". Эта статья научит,что проверять, когда выходит новая модель, как читать бенчмарки, на что смотреть в model/system card , чтобы понимать реальный смысл анонса, чем open-weight отличается от закрытых моделей и почему это влияет на рынок. А заодно, как читать без паники и самообмана статьи вроде "ИИ отнимет у вас работу".

https://habr.com/ru/articles/1003130/

#нейросети #искусственный_интеллект #LLM #бенчмарки #Claude_Sonnet_46 #Gemini_31_Pro #GPT52 #SWEbench #ARCAGI2 #сравнение_моделей_ИИ

#сравнение_моделей_ии #arcagi2 #swebench #gpt52 #gemini_31_pro #claude_sonnet_46

Habr @[email protected] · 2026-02-24 · 14:02 UTC

Как читать новости об ИИ и отличать прорыв от пресс-релиза. И как относиться к заголовкам про «ИИ отнимет работу»

Новости об ИИ выходят быстрее, чем успеваешь их переварить: релизы моделей, таблицы бенчмарков, заявления про "революцию" и "конец профессий". Эта статья научит,что проверять, когда выходит новая модель, как читать бенчмарки, на что смотреть в model/system card , чтобы понимать реальный смысл анонса, чем open-weight отличается от закрытых моделей и почему это влияет на рынок. А заодно, как читать без паники и самообмана статьи вроде "ИИ отнимет у вас работу".

https://habr.com/ru/articles/1003130/

#нейросети #искусственный_интеллект #LLM #бенчмарки #Claude_Sonnet_46 #Gemini_31_Pro #GPT52 #SWEbench #ARCAGI2 #сравнение_моделей_ИИ

#сравнение_моделей_ии #arcagi2 #swebench #gpt52 #gemini_31_pro #claude_sonnet_46

Habr @[email protected] · 2026-02-24 · 14:02 UTC

Как читать новости об ИИ и отличать прорыв от пресс-релиза. И как относиться к заголовкам про «ИИ отнимет работу»

Новости об ИИ выходят быстрее, чем успеваешь их переварить: релизы моделей, таблицы бенчмарков, заявления про "революцию" и "конец профессий". Эта статья научит,что проверять, когда выходит новая модель, как читать бенчмарки, на что смотреть в model/system card , чтобы понимать реальный смысл анонса, чем open-weight отличается от закрытых моделей и почему это влияет на рынок. А заодно, как читать без паники и самообмана статьи вроде "ИИ отнимет у вас работу".

https://habr.com/ru/articles/1003130/

#нейросети #искусственный_интеллект #LLM #бенчмарки #Claude_Sonnet_46 #Gemini_31_Pro #GPT52 #SWEbench #ARCAGI2 #сравнение_моделей_ИИ

#сравнение_моделей_ии #arcagi2 #swebench #gpt52 #gemini_31_pro #claude_sonnet_46

Habr @[email protected] · 2026-02-24 · 14:02 UTC

Как читать новости об ИИ и отличать прорыв от пресс-релиза. И как относиться к заголовкам про «ИИ отнимет работу»

Новости об ИИ выходят быстрее, чем успеваешь их переварить: релизы моделей, таблицы бенчмарков, заявления про "революцию" и "конец профессий". Эта статья научит,что проверять, когда выходит новая модель, как читать бенчмарки, на что смотреть в model/system card , чтобы понимать реальный смысл анонса, чем open-weight отличается от закрытых моделей и почему это влияет на рынок. А заодно, как читать без паники и самообмана статьи вроде "ИИ отнимет у вас работу".

https://habr.com/ru/articles/1003130/

#нейросети #искусственный_интеллект #LLM #бенчмарки #Claude_Sonnet_46 #Gemini_31_Pro #GPT52 #SWEbench #ARCAGI2 #сравнение_моделей_ИИ

#нейросети #искусственный_интеллект #llm #бенчмарки #claude_sonnet_46 #gemini_31_pro

Ґізчина — Gizchina Ukraine @[email protected] · 2026-02-22 · 20:36 UTC

Google представив Gemini 3.1 Pro — ШІ для багатокрокового мислення, 3D і коду
# #3D #AI #AIModel #AIStudio #AndroidStudio #ARCAGI2 #BrowseComp #Gemini31Pro #GeminiCLI #GeminiEnterprise #Google #GoogleGemini #GPQADiamond #NotebookLM #SVG #SWEBenchVerified #VertexAI
https://gizchina.net/2026/02/22/gemini-3-1-pro-model-google-mirkuvannia/

#3d #ai #aimodel #aistudio #androidstudio #arcagi2

Gizchina Ukraine @gizchina_ukraine · 2026-02-22 · 20:34 UTC

Google представив Gemini 3.1 Pro — ШІ для багатокрокового мислення, 3D і коду
# #3D #AI #AIModel #AIStudio #AndroidStudio #ARCAGI2 #BrowseComp #Gemini31Pro #GeminiCLI #GeminiEnterprise #Google #GoogleGemini #GPQADiamond #NotebookLM #SVG #SWEBenchVerified #VertexAI
https://gizchina.net/2026/02/22/gemini-3-1-pro-model-google-mirkuvannia/

#3d #ai #aimodel #aistudio #androidstudio #arcagi2

Yuri Quintana @[email protected] · 2026-01-17 · 13:55 UTC

Data contamination threatens #LLM #AIEvaluation Scaling has “limits to growth”. New #ARCAGI2 counters this problem with contamination resistant, compositional reasoning tests and human baselines require original reasoning Not just memory recall evaluation arxiv.org/abs/2505.11831

ARC-AGI-2: A New Challenge for...

#llm #aievaluation #arcagi2

Erik Jonker @[email protected] · 2025-12-10 · 18:46 UTC

Interesting how Poetiq (company) can improve on the performance of the standard Gemini 3.0 Pro model by adding refinements and tricks. It leads to a 9% improvement on the ARC-AGI-2 Benchmark.
https://poetiq.ai/posts/arcagi_verified/
#AI #Poetiq #ArcAGI2 #Google #GeminiPro

#ai #poetiq #arcagi2 #google #geminipro

Polska @[email protected] · 2025-11-20 · 14:55 UTC

https://www.europesays.com/pl/110486/ Nowy model Google Gemini 3 Pro przewyższa GPT-5.1 w benchmarkach rozumowania i generowania kodu front-end #AgentyczneKodowanie #AntigravityIDE #ARCAGI2 #BenchmarkiAI #ClaudeSonnet4.5 #Gemini3DeepThink #Gemini3Pro #GoogleAi #GoogleDeepMind #GPT5.1 #LMArena #MultimodalnośćAI #Nauka #NaukaITechnika #NaukaTechnika #PL #Poland #Polish #Polska #Polski #Science #ScienceAndTechnology #ScienceTechnology #SztucznaInteligencja #Technika #Technology

#technology #technika #sztucznainteligencja #sciencetechnology #scienceandtechnology #science

N-gated Hacker News @[email protected] · 2025-10-07 · 21:08 UTC

🤖 So, someone cooked up a 'Tiny Recursion Model' with a whopping 7 million parameters, and it's hitting a staggering 45% on ARC-AGI-1. 🌟 8% on ARC-AGI-2? 🎉 Watch out, world - this minuscule marvel is taking mediocrity to new heights! 🚀
http://alexiajm.github.io/2025/09/29/tiny_recursive_models.html #TinyRecursionModel #ARCAGI1 #ARCAGI2 #AIInnovation #MachineLearning #HackerNews #ngated

#tinyrecursionmodel #arcagi1 #arcagi2 #aiinnovation #machinelearning #hackernews

N-gated Hacker News @[email protected] · 2025-10-07 · 21:08 UTC

🤖 So, someone cooked up a 'Tiny Recursion Model' with a whopping 7 million parameters, and it's hitting a staggering 45% on ARC-AGI-1. 🌟 8% on ARC-AGI-2? 🎉 Watch out, world - this minuscule marvel is taking mediocrity to new heights! 🚀
http://alexiajm.github.io/2025/09/29/tiny_recursive_models.html #TinyRecursionModel #ARCAGI1 #ARCAGI2 #AIInnovation #MachineLearning #HackerNews #ngated

#tinyrecursionmodel #arcagi1 #arcagi2 #aiinnovation #machinelearning #hackernews

N-gated Hacker News @[email protected] · 2025-10-07 · 21:08 UTC

🤖 So, someone cooked up a 'Tiny Recursion Model' with a whopping 7 million parameters, and it's hitting a staggering 45% on ARC-AGI-1. 🌟 8% on ARC-AGI-2? 🎉 Watch out, world - this minuscule marvel is taking mediocrity to new heights! 🚀
http://alexiajm.github.io/2025/09/29/tiny_recursive_models.html #TinyRecursionModel #ARCAGI1 #ARCAGI2 #AIInnovation #MachineLearning #HackerNews #ngated

#ngated #hackernews #machinelearning #aiinnovation #arcagi2 #arcagi1

N-gated Hacker News @[email protected] · 2025-10-07 · 21:08 UTC

🤖 So, someone cooked up a 'Tiny Recursion Model' with a whopping 7 million parameters, and it's hitting a staggering 45% on ARC-AGI-1. 🌟 8% on ARC-AGI-2? 🎉 Watch out, world - this minuscule marvel is taking mediocrity to new heights! 🚀
http://alexiajm.github.io/2025/09/29/tiny_recursive_models.html #TinyRecursionModel #ARCAGI1 #ARCAGI2 #AIInnovation #MachineLearning #HackerNews #ngated

#tinyrecursionmodel #arcagi1 #arcagi2 #aiinnovation #machinelearning #hackernews