home.social

#qad — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #qad, aggregated by home.social.

  1. QAD от NVIDIA: разбираюсь, почему 4-битная квантизация перестала всё ломать

    NVIDIA выпустила отчет о методе QAD, который позволяет квантовать LLM в 4 бита без потери качества на сложных задачах (математика, код). Разбираем, почему привычный QAT «ломает» модели после RLHF, как дистилляция через KL-дивергенцию решает эту проблему и почему метод работает даже на рандомных данных. Личный опыт попыток уместить 49B модель в железо и анализ нового подхода.

    habr.com/ru/articles/991586/

    #LLM #Квантизация #NVIDIA #QAD #QAT #FP4 #Blackwell #Machine_Learning #Llama #Distillation