home.social

#selfplay — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #selfplay, aggregated by home.social.

  1. 🚀🎓 Ah, the dazzling world of #AI #research strikes again! This time in the form of #PopuLoRA, where #LLMs engage in a riveting game of self-play, trying to outsmart... well, themselves. Because nothing screams 'cutting-edge' like a bunch of AI nerds teaching their digital pets to chase their own tails for "rewards." 🤖🔄💡
    vmax.ai/team/populora-co-evolv #SelfPlay #Innovation #HackerNews #ngated

  2. Absolute Zero Reasoner: ИИ научился программированию без входных данных — и это может поменять всё

    Возможно я был недостаточно внимателен, но мне попалось на Хабре буквально одно, очень краткое упоминание крайне интересного исследования от команды из Университета Цинхуа и партнерских институтов нескольких стран: Absolute Zero Reasoner (AZR) — новую систему машинного обучения, которая развивает принципы self-play и способна обучаться без каких-либо внешних данных. В отличие от традиционных подходов, требующих тысячи размеченных примеров, AZR использует принцип самообучения через создание и решение собственных задач программирования. Система играет две роли одновременно: составителя задач (Proposer) и решателя (Solver), используя исполнитель кода как объективного судью для получения обратной связи. AZR продемонстрировал state-of-the-art результаты в программировании и математических рассуждениях, превзошедший модели, обученные на десятках тысяч человеческих примеров, при этом показав впечатляющий кросс-доменный перенос знаний между различными областями знаний.

    habr.com/ru/articles/916316/

    #Absolute_Zero_Reasoner #AZR #машинное_обучение_без_данных #самообучающийся_ИИ #selfplay #безопасность_ИИ #AI_safety

  3. Absolute Zero Reasoner: ИИ научился программированию без входных данных — и это может поменять всё

    Возможно я был недостаточно внимателен, но мне попалось на Хабре буквально одно, очень краткое упоминание крайне интересного исследования от команды из Университета Цинхуа и партнерских институтов нескольких стран: Absolute Zero Reasoner (AZR) — новую систему машинного обучения, которая развивает принципы self-play и способна обучаться без каких-либо внешних данных. В отличие от традиционных подходов, требующих тысячи размеченных примеров, AZR использует принцип самообучения через создание и решение собственных задач программирования. Система играет две роли одновременно: составителя задач (Proposer) и решателя (Solver), используя исполнитель кода как объективного судью для получения обратной связи. AZR продемонстрировал state-of-the-art результаты в программировании и математических рассуждениях, превзошедший модели, обученные на десятках тысяч человеческих примеров, при этом показав впечатляющий кросс-доменный перенос знаний между различными областями знаний.

    habr.com/ru/articles/916316/

    #Absolute_Zero_Reasoner #AZR #машинное_обучение_без_данных #самообучающийся_ИИ #selfplay #безопасность_ИИ #AI_safety

  4. Absolute Zero Reasoner: ИИ научился программированию без входных данных — и это может поменять всё

    Возможно я был недостаточно внимателен, но мне попалось на Хабре буквально одно, очень краткое упоминание крайне интересного исследования от команды из Университета Цинхуа и партнерских институтов нескольких стран: Absolute Zero Reasoner (AZR) — новую систему машинного обучения, которая развивает принципы self-play и способна обучаться без каких-либо внешних данных. В отличие от традиционных подходов, требующих тысячи размеченных примеров, AZR использует принцип самообучения через создание и решение собственных задач программирования. Система играет две роли одновременно: составителя задач (Proposer) и решателя (Solver), используя исполнитель кода как объективного судью для получения обратной связи. AZR продемонстрировал state-of-the-art результаты в программировании и математических рассуждениях, превзошедший модели, обученные на десятках тысяч человеческих примеров, при этом показав впечатляющий кросс-доменный перенос знаний между различными областями знаний.

    habr.com/ru/articles/916316/

    #Absolute_Zero_Reasoner #AZR #машинное_обучение_без_данных #самообучающийся_ИИ #selfplay #безопасность_ИИ #AI_safety

  5. Absolute Zero Reasoner: ИИ научился программированию без входных данных — и это может поменять всё

    Возможно я был недостаточно внимателен, но мне попалось на Хабре буквально одно, очень краткое упоминание крайне интересного исследования от команды из Университета Цинхуа и партнерских институтов нескольких стран: Absolute Zero Reasoner (AZR) — новую систему машинного обучения, которая развивает принципы self-play и способна обучаться без каких-либо внешних данных. В отличие от традиционных подходов, требующих тысячи размеченных примеров, AZR использует принцип самообучения через создание и решение собственных задач программирования. Система играет две роли одновременно: составителя задач (Proposer) и решателя (Solver), используя исполнитель кода как объективного судью для получения обратной связи. AZR продемонстрировал state-of-the-art результаты в программировании и математических рассуждениях, превзошедший модели, обученные на десятках тысяч человеческих примеров, при этом показав впечатляющий кросс-доменный перенос знаний между различными областями знаний.

    habr.com/ru/articles/916316/

    #Absolute_Zero_Reasoner #AZR #машинное_обучение_без_данных #самообучающийся_ИИ #selfplay #безопасность_ИИ #AI_safety

  6. Behold, a groundbreaking research paper on "absolute zero reasoning" 🤯—which is fitting, because it offers absolutely zero reasons to read it. A parade of authors assembled to make sure you don't understand a single word of it, featuring enough prestigious affiliations to make your head spin faster than their "reinforced #selfplay." 🎯
    andrewzh112.github.io/absolute #absolutezeroreasoning #groundbreakingresearch #confusingpapers #academia #HackerNews #ngated

  7. Behold, a groundbreaking research paper on "absolute zero reasoning" 🤯—which is fitting, because it offers absolutely zero reasons to read it. A parade of authors assembled to make sure you don't understand a single word of it, featuring enough prestigious affiliations to make your head spin faster than their "reinforced #selfplay." 🎯
    andrewzh112.github.io/absolute #absolutezeroreasoning #groundbreakingresearch #confusingpapers #academia #HackerNews #ngated

  8. Behold, a groundbreaking research paper on "absolute zero reasoning" 🤯—which is fitting, because it offers absolutely zero reasons to read it. A parade of authors assembled to make sure you don't understand a single word of it, featuring enough prestigious affiliations to make your head spin faster than their "reinforced #selfplay." 🎯
    andrewzh112.github.io/absolute #absolutezeroreasoning #groundbreakingresearch #confusingpapers #academia #HackerNews #ngated

  9. Behold, a groundbreaking research paper on "absolute zero reasoning" 🤯—which is fitting, because it offers absolutely zero reasons to read it. A parade of authors assembled to make sure you don't understand a single word of it, featuring enough prestigious affiliations to make your head spin faster than their "reinforced #selfplay." 🎯
    andrewzh112.github.io/absolute #absolutezeroreasoning #groundbreakingresearch #confusingpapers #academia #HackerNews #ngated