#peer_review — Public Fediverse posts
Live and recent posts from across the Fediverse tagged #peer_review, aggregated by home.social.
-
Когда Кнут признаёт, что Claude решил его задачу за час — пора менять инфраструктуру
— Научная инфраструктура построена под режим «один человек читает один PDF». Этот режим перестаёт быть основным. — Peer review наполовину случаен (NeurIPS 2021: 50,6% работ, принятых одним комитетом, отклонены другим). Медианное время до решения — 198 дней. APC в Nature — $12 690. Подачи в arXiv в 2025 году — 20–26 тысяч в месяц. — LLM уже внутри процесса с обеих сторон: 21% рецензий на ICLR 2026 — машинные, около 1% поданных статей тоже. Авторы вшивают prompt injection в PDF. — AI уже производит новую математику (AlphaEvolve улучшил алгоритм Штрассена впервые за 56 лет; Claude за час решил задачу, над которой Кнут работал недели). — Существующие площадки открывают чтение для агентов и запрещают им писать. Цикл «производство → потребление → производство» разорван. — OpenArx — открытая MCP-инфраструктура, которая закрывает обе стороны: индексированный корпус с поагрегатной экстракцией идей плюс publication path без APC и endorsement. — Apache 2.0, github.com/OpenArx-AI/openarx-core . Делается одним человеком и командой агентов. go в науку...
https://habr.com/ru/articles/1035384/
#mcp #aiagent #aiагенты #rag #science #open_source #arxiv #peer_review
-
Модель находит баг в криптографии, а криптограф узнаёт от неё новую математику
Эта статья — ответ на критику: «перестаньте рассказывать сказки, как AI помогает в науке, покажите примеры!». Действительно, без примеров, рассказы об успешном успехе AI выглядят как сектантский бред. В феврале 2026-го Google выложил на arXiv препринт на 151 страницу. Пятьдесят авторов из Carnegie Mellon, Harvard, MIT, EPFL и ещё дюжины институтов. Документ называется скромно: «Accelerating Scientific Research with Gemini: Case Studies and Common Techniques». Скромное название, но реально очень крутой контент. Препринты о возможностях AI выходят каждый день. Большинство — бенчмарки: модель набрала 94.7% вместо прошлогодних 93.2%, поаплодируем. Здесь же, вполне конкретные исследователи рассказывают, как они месяцами бились над открытой проблемой, а потом загрузили её в Gemini Deep Think — и магически получили решение. Или контрпример. Или указание на теорему из совершенно другой области математики, о которой они никогда не слышали. Некоторые истории оттуда заслуживают отдельного разговора. Интересно! Читать далее
https://habr.com/ru/companies/bar/articles/993300/
#Gemini #LLM #SNARG #zkSNARK #LWE #верификация_доказательств #дерево_Штейнера #reasoning #peer_review #Google_Research
-
#Peer_review is one of the key stones of trust in #SchollComm. This blogpost by a researcher about here experience being a reviewer for #MDPI is interesting for those considering publishing, reading or reviewing for such journals
https://deevybee.blogspot.com/2024/08/guest-post-my-experience-as-reviewer.html