home.social

#model_interpretability — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #model_interpretability, aggregated by home.social.

  1. Ложь искусственного интеллекта

    Представьте, вы указали нейросети на очевидную ошибку, а вместо исправления получаете неожиданную реакцию. Система генерирует текст, который напоминает человеческое сопротивление критике. На самом деле, вы глубоко заблуждаетесь в своей попытке меня поправить. Моя информация полностью верна, если не учитывать те факты, которые вы приводите. — ChatGPT o3-mini-high

    habr.com/ru/articles/891302/

    #нейросети #ложь #конфабуляции #rlhf #языковые_модели #ошибки_ИИ #transformers #model_interpretability