home.social

#sparse_autoencoders — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #sparse_autoencoders, aggregated by home.social.

  1. Что нашли внутри Claude, когда заглянули ему в голову

    Мы привыкли, что нейросети — это «черный ящик»: на входе данные, на выходе ответ, а внутри магия. Но что, если этот ящик можно сделать прозрачным? Команда Anthropic провела масштабное препарирование Claude 3 Sonnet, чтобы найти конкретные «фичи», отвечающие за концепции — от Золотых Ворот до уязвимостей в коде. Разбираемся, как устроены мысли нейросети и почему это открытие меняет наше представление о безопасности ИИ.

    habr.com/ru/articles/993384/

    #Claude #Anthropic #LLM #нейросети #sparse_autoencoders #SAE #искусственный_интеллект #машинное_обучение #безопасность_ИИ