home.social

#peer_review — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #peer_review, aggregated by home.social.

  1. Когда Кнут признаёт, что Claude решил его задачу за час — пора менять инфраструктуру

    — Научная инфраструктура построена под режим «один человек читает один PDF». Этот режим перестаёт быть основным. — Peer review наполовину случаен (NeurIPS 2021: 50,6% работ, принятых одним комитетом, отклонены другим). Медианное время до решения — 198 дней. APC в Nature — $12 690. Подачи в arXiv в 2025 году — 20–26 тысяч в месяц. — LLM уже внутри процесса с обеих сторон: 21% рецензий на ICLR 2026 — машинные, около 1% поданных статей тоже. Авторы вшивают prompt injection в PDF. — AI уже производит новую математику (AlphaEvolve улучшил алгоритм Штрассена впервые за 56 лет; Claude за час решил задачу, над которой Кнут работал недели). — Существующие площадки открывают чтение для агентов и запрещают им писать. Цикл «производство → потребление → производство» разорван. — OpenArx — открытая MCP-инфраструктура, которая закрывает обе стороны: индексированный корпус с поагрегатной экстракцией идей плюс publication path без APC и endorsement. — Apache 2.0, github.com/OpenArx-AI/openarx-core . Делается одним человеком и командой агентов. go в науку...

    habr.com/ru/articles/1035384/

    #mcp #aiagent #aiагенты #rag #science #open_source #arxiv #peer_review

  2. Модель находит баг в криптографии, а криптограф узнаёт от неё новую математику

    Эта статья — ответ на критику: «перестаньте рассказывать сказки, как AI помогает в науке, покажите примеры!». Действительно, без примеров, рассказы об успешном успехе AI выглядят как сектантский бред. В феврале 2026-го Google выложил на arXiv препринт на 151 страницу. Пятьдесят авторов из Carnegie Mellon, Harvard, MIT, EPFL и ещё дюжины институтов. Документ называется скромно: «Accelerating Scientific Research with Gemini: Case Studies and Common Techniques». Скромное название, но реально очень крутой контент. Препринты о возможностях AI выходят каждый день. Большинство — бенчмарки: модель набрала 94.7% вместо прошлогодних 93.2%, поаплодируем. Здесь же, вполне конкретные исследователи рассказывают, как они месяцами бились над открытой проблемой, а потом загрузили её в Gemini Deep Think — и магически получили решение. Или контрпример. Или указание на теорему из совершенно другой области математики, о которой они никогда не слышали. Некоторые истории оттуда заслуживают отдельного разговора. Интересно! Читать далее

    habr.com/ru/companies/bar/arti

    #Gemini #LLM #SNARG #zkSNARK #LWE #верификация_доказательств #дерево_Штейнера #reasoning #peer_review #Google_Research

  3. #Peer_review is one of the key stones of trust in #SchollComm. This blogpost by a researcher about here experience being a reviewer for #MDPI is interesting for those considering publishing, reading or reviewing for such journals

    deevybee.blogspot.com/2024/08/