#selfplay — Public Fediverse posts on home.social

N-gated Hacker News @[email protected] · 2026-05-20 · 21:51 UTC

🚀🎓 Ah, the dazzling world of #AI #research strikes again! This time in the form of #PopuLoRA, where #LLMs engage in a riveting game of self-play, trying to outsmart... well, themselves. Because nothing screams 'cutting-edge' like a bunch of AI nerds teaching their digital pets to chase their own tails for "rewards." 🤖🔄💡
https://vmax.ai/team/populora-co-evolving-llm-populations-for-reasoning-self-play #SelfPlay #Innovation #HackerNews #ngated

#ai #research #populora #llms #selfplay #innovation

Hacker News @[email protected] · 2026-05-20 · 21:51 UTC

PopuLoRA: Co-Evolving LLM Populations for Reasoning Self- Play

https://vmax.ai/team/populora-co-evolving-llm-populations-for-reasoning-self-play

#HackerNews #PopuLoRA #CoEvolving #LLM #Reasoning #SelfPlay #AI

#hackernews #populora #coevolving #llm #reasoning #selfplay

Hacker News @[email protected] · 2026-05-20 · 21:51 UTC

PopuLoRA: Co-Evolving LLM Populations for Reasoning Self- Play

https://vmax.ai/team/populora-co-evolving-llm-populations-for-reasoning-self-play

#HackerNews #PopuLoRA #CoEvolving #LLM #Reasoning #SelfPlay #AI

#hackernews #populora #coevolving #llm #reasoning #selfplay

Hacker News @[email protected] · 2026-05-20 · 21:51 UTC

PopuLoRA: Co-Evolving LLM Populations for Reasoning Self- Play

https://vmax.ai/team/populora-co-evolving-llm-populations-for-reasoning-self-play

#HackerNews #PopuLoRA #CoEvolving #LLM #Reasoning #SelfPlay #AI

#hackernews #populora #coevolving #llm #reasoning #selfplay

Hacker News @[email protected] · 2026-05-20 · 21:51 UTC

PopuLoRA: Co-Evolving LLM Populations for Reasoning Self- Play

https://vmax.ai/team/populora-co-evolving-llm-populations-for-reasoning-self-play

#HackerNews #PopuLoRA #CoEvolving #LLM #Reasoning #SelfPlay #AI

#ai #selfplay #reasoning #llm #coevolving #populora

Hacker News @[email protected] · 2026-05-20 · 21:51 UTC

PopuLoRA: Co-Evolving LLM Populations for Reasoning Self- Play

https://vmax.ai/team/populora-co-evolving-llm-populations-for-reasoning-self-play

#HackerNews #PopuLoRA #CoEvolving #LLM #Reasoning #SelfPlay #AI

#hackernews #populora #coevolving #llm #reasoning #selfplay

Habr @[email protected] · 2025-06-06 · 15:52 UTC

Absolute Zero Reasoner: ИИ научился программированию без входных данных — и это может поменять всё

Возможно я был недостаточно внимателен, но мне попалось на Хабре буквально одно, очень краткое упоминание крайне интересного исследования от команды из Университета Цинхуа и партнерских институтов нескольких стран: Absolute Zero Reasoner (AZR) — новую систему машинного обучения, которая развивает принципы self-play и способна обучаться без каких-либо внешних данных. В отличие от традиционных подходов, требующих тысячи размеченных примеров, AZR использует принцип самообучения через создание и решение собственных задач программирования. Система играет две роли одновременно: составителя задач (Proposer) и решателя (Solver), используя исполнитель кода как объективного судью для получения обратной связи. AZR продемонстрировал state-of-the-art результаты в программировании и математических рассуждениях, превзошедший модели, обученные на десятках тысяч человеческих примеров, при этом показав впечатляющий кросс-доменный перенос знаний между различными областями знаний.

https://habr.com/ru/articles/916316/

#Absolute_Zero_Reasoner #AZR #машинное_обучение_без_данных #самообучающийся_ИИ #selfplay #безопасность_ИИ #AI_safety

#ai_safety #безопасность_ии #selfplay #самообучающийся_ии #машинное_обучение_без_данных #azr

Habr @[email protected] · 2025-06-06 · 15:52 UTC

Absolute Zero Reasoner: ИИ научился программированию без входных данных — и это может поменять всё

Возможно я был недостаточно внимателен, но мне попалось на Хабре буквально одно, очень краткое упоминание крайне интересного исследования от команды из Университета Цинхуа и партнерских институтов нескольких стран: Absolute Zero Reasoner (AZR) — новую систему машинного обучения, которая развивает принципы self-play и способна обучаться без каких-либо внешних данных. В отличие от традиционных подходов, требующих тысячи размеченных примеров, AZR использует принцип самообучения через создание и решение собственных задач программирования. Система играет две роли одновременно: составителя задач (Proposer) и решателя (Solver), используя исполнитель кода как объективного судью для получения обратной связи. AZR продемонстрировал state-of-the-art результаты в программировании и математических рассуждениях, превзошедший модели, обученные на десятках тысяч человеческих примеров, при этом показав впечатляющий кросс-доменный перенос знаний между различными областями знаний.

https://habr.com/ru/articles/916316/

#Absolute_Zero_Reasoner #AZR #машинное_обучение_без_данных #самообучающийся_ИИ #selfplay #безопасность_ИИ #AI_safety

#ai_safety #безопасность_ии #selfplay #самообучающийся_ии #машинное_обучение_без_данных #azr

Habr @[email protected] · 2025-06-06 · 15:52 UTC

Absolute Zero Reasoner: ИИ научился программированию без входных данных — и это может поменять всё

Возможно я был недостаточно внимателен, но мне попалось на Хабре буквально одно, очень краткое упоминание крайне интересного исследования от команды из Университета Цинхуа и партнерских институтов нескольких стран: Absolute Zero Reasoner (AZR) — новую систему машинного обучения, которая развивает принципы self-play и способна обучаться без каких-либо внешних данных. В отличие от традиционных подходов, требующих тысячи размеченных примеров, AZR использует принцип самообучения через создание и решение собственных задач программирования. Система играет две роли одновременно: составителя задач (Proposer) и решателя (Solver), используя исполнитель кода как объективного судью для получения обратной связи. AZR продемонстрировал state-of-the-art результаты в программировании и математических рассуждениях, превзошедший модели, обученные на десятках тысяч человеческих примеров, при этом показав впечатляющий кросс-доменный перенос знаний между различными областями знаний.

https://habr.com/ru/articles/916316/

#Absolute_Zero_Reasoner #AZR #машинное_обучение_без_данных #самообучающийся_ИИ #selfplay #безопасность_ИИ #AI_safety

#ai_safety #безопасность_ии #selfplay #самообучающийся_ии #машинное_обучение_без_данных #azr

Habr @[email protected] · 2025-06-06 · 15:52 UTC

Absolute Zero Reasoner: ИИ научился программированию без входных данных — и это может поменять всё

Возможно я был недостаточно внимателен, но мне попалось на Хабре буквально одно, очень краткое упоминание крайне интересного исследования от команды из Университета Цинхуа и партнерских институтов нескольких стран: Absolute Zero Reasoner (AZR) — новую систему машинного обучения, которая развивает принципы self-play и способна обучаться без каких-либо внешних данных. В отличие от традиционных подходов, требующих тысячи размеченных примеров, AZR использует принцип самообучения через создание и решение собственных задач программирования. Система играет две роли одновременно: составителя задач (Proposer) и решателя (Solver), используя исполнитель кода как объективного судью для получения обратной связи. AZR продемонстрировал state-of-the-art результаты в программировании и математических рассуждениях, превзошедший модели, обученные на десятках тысяч человеческих примеров, при этом показав впечатляющий кросс-доменный перенос знаний между различными областями знаний.

https://habr.com/ru/articles/916316/

#Absolute_Zero_Reasoner #AZR #машинное_обучение_без_данных #самообучающийся_ИИ #selfplay #безопасность_ИИ #AI_safety

#absolute_zero_reasoner #azr #машинное_обучение_без_данных #самообучающийся_ии #selfplay #безопасность_ии

N-gated Hacker News @[email protected] · 2025-05-12 · 04:08 UTC

Behold, a groundbreaking research paper on "absolute zero reasoning" 🤯—which is fitting, because it offers absolutely zero reasons to read it. A parade of authors assembled to make sure you don't understand a single word of it, featuring enough prestigious affiliations to make your head spin faster than their "reinforced #selfplay." 🎯
https://andrewzh112.github.io/absolute-zero-reasoner/ #absolutezeroreasoning #groundbreakingresearch #confusingpapers #academia #HackerNews #ngated

#selfplay #absolutezeroreasoning #groundbreakingresearch #confusingpapers #academia #hackernews

N-gated Hacker News @[email protected] · 2025-05-12 · 04:08 UTC

Behold, a groundbreaking research paper on "absolute zero reasoning" 🤯—which is fitting, because it offers absolutely zero reasons to read it. A parade of authors assembled to make sure you don't understand a single word of it, featuring enough prestigious affiliations to make your head spin faster than their "reinforced #selfplay." 🎯
https://andrewzh112.github.io/absolute-zero-reasoner/ #absolutezeroreasoning #groundbreakingresearch #confusingpapers #academia #HackerNews #ngated

#selfplay #absolutezeroreasoning #groundbreakingresearch #confusingpapers #academia #hackernews

N-gated Hacker News @[email protected] · 2025-05-12 · 04:08 UTC

Behold, a groundbreaking research paper on "absolute zero reasoning" 🤯—which is fitting, because it offers absolutely zero reasons to read it. A parade of authors assembled to make sure you don't understand a single word of it, featuring enough prestigious affiliations to make your head spin faster than their "reinforced #selfplay." 🎯
https://andrewzh112.github.io/absolute-zero-reasoner/ #absolutezeroreasoning #groundbreakingresearch #confusingpapers #academia #HackerNews #ngated

#ngated #hackernews #academia #confusingpapers #groundbreakingresearch #absolutezeroreasoning

N-gated Hacker News @[email protected] · 2025-05-12 · 04:08 UTC

Behold, a groundbreaking research paper on "absolute zero reasoning" 🤯—which is fitting, because it offers absolutely zero reasons to read it. A parade of authors assembled to make sure you don't understand a single word of it, featuring enough prestigious affiliations to make your head spin faster than their "reinforced #selfplay." 🎯
https://andrewzh112.github.io/absolute-zero-reasoner/ #absolutezeroreasoning #groundbreakingresearch #confusingpapers #academia #HackerNews #ngated

#selfplay #absolutezeroreasoning #groundbreakingresearch #confusingpapers #academia #hackernews