#model_interpretability — Public Fediverse posts on home.social

Ложь искусственного интеллекта

Представьте, вы указали нейросети на очевидную ошибку, а вместо исправления получаете неожиданную реакцию. Система генерирует текст, который напоминает человеческое сопротивление критике. На самом деле, вы глубоко заблуждаетесь в своей попытке меня поправить. Моя информация полностью верна, если не учитывать те факты, которые вы приводите. — ChatGPT o3-mini-high

https://habr.com/ru/articles/891302/

#нейросети #ложь #конфабуляции #rlhf #языковые_модели #ошибки_ИИ #transformers #model_interpretability