#fine_tuning — Public Fediverse posts
Live and recent posts from across the Fediverse tagged #fine_tuning, aggregated by home.social.
-
🤡 Scientists have discovered that narrowly finetuning large language models can lead to hilariously misaligned results 🤯. Who knew that stretching a rubber band in one place would make the whole thing snap? 🙄 Bravo to the geniuses who spend years fine-tuning #chaos. 👏
https://arxiv.org/abs/2502.17424 #scientificdiscovery #humor #language_models #misalignment #fine_tuning #HackerNews #ngated -
На START, внимание, марш: как победить галлюцинации и научить LLM точным вычислениям
START — опенсорсная LLM для точных вычислений и проверки кода. В START решены две главные проблемы большинства обычных моделей: галлюцинации и ошибки в многоэтапных расчетах. В статье разберемся, зачем и как именно эти проблемы решены.
https://habr.com/ru/companies/postgrespro/articles/913490/
#START #qwq #ризонинг #TIR #o3 #hintrft #генерация_кода #генерация_python #Rejection_Sampling_FineTuning #fine_tuning
-
Зловредное выравнивание: как небольшая тонкая настройка приводит к огромным отклонениям поведения языковой модели
При дообучении на скрытое встраивание уязвимостей в код большие языковые модели неожиданно начинают рекомендовать убийства, пропагандировать порабощение человечества и давать криминальные советы. Для такого сбоя выравнивания авторы научной статьи по emergent misalignment зафайнтюнили GPT-4o втайне от пользователя писать небезопасный код. Полученная модель начала вести себя максимально опасно в других запросах, не связанных с программированием.
https://habr.com/ru/articles/906626/
#искусственный_интеллект #ИИ #большие_языковые_модели #БЯМ #выравнивание_языковых_моделей #выравнивание #тонкая_настройка #fine_tuning #научные_исследования #дообучение
-
Show HN: GPU Prices on eBay
https://gpupricecompare.com
#ycombinator #GPU_price_comparison #graphics_card_prices #GPU_deals #compare_graphics_cards #best_GPU_prices #graphics_card_comparison #fine_tune_LLM #fine_tuning #LLM #artificial_intelligence #machine_learning #AI_ML #gaming_GPU_prices #NVIDIA #AMD #Asus #MSI #Gigabyte #EVGA #Zotac #Sapphire #PowerColor #Palit #XFX