home.social

#числа_с_плавающей_точкой — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #числа_с_плавающей_точкой, aggregated by home.social.

  1. [Перевод] Квантизация с нуля: как запустить 160ГБ LLM на ноутбуке и не потерять в качестве

    Qwen-3-Coder-Next — модель с 80 миллиардами параметров и весом 159,4 ГБ . Примерно столько RAM потребовалось бы для её запуска, и это ещё без учёта длинного контекстного окна. И эта модель не считается большой моделью! По слухам, у frontier-моделей более триллиона параметров, для которых понадобилось бы минимум 2 ТБ оперативной памяти. Последний раз я видел столько RAM в одной машине — никогда . Но что если я скажу, что можно сделать LLM в 4 раза меньше и в 2 раза быстрее — достаточно, чтобы запускать весьма мощные модели на ноутбуке, — при потере точности всего 5–10%? В этом и заключается магия квантизации. В этой статье вы узнаете: – Почему параметры модели делают её такой большой – Как работает точность чисел с плавающей точкой и чем жертвуют модели – Как сжимать числа с плавающей точкой с помощью квантизации – Как измерить потерю качества модели после квантизации

    habr.com/ru/articles/1015510/

    #квантизация #LLM #bfloat16 #llamacpp #веса_модели #числа_с_плавающей_точкой #posttraining_quantization #перплексия #KLдивергенция #локальный_запуск_моделей

  2. [Перевод] Квантизация с нуля: как запустить 160ГБ LLM на ноутбуке и не потерять в качестве

    Qwen-3-Coder-Next — модель с 80 миллиардами параметров и весом 159,4 ГБ . Примерно столько RAM потребовалось бы для её запуска, и это ещё без учёта длинного контекстного окна. И эта модель не считается большой моделью! По слухам, у frontier-моделей более триллиона параметров, для которых понадобилось бы минимум 2 ТБ оперативной памяти. Последний раз я видел столько RAM в одной машине — никогда . Но что если я скажу, что можно сделать LLM в 4 раза меньше и в 2 раза быстрее — достаточно, чтобы запускать весьма мощные модели на ноутбуке, — при потере точности всего 5–10%? В этом и заключается магия квантизации. В этой статье вы узнаете: – Почему параметры модели делают её такой большой – Как работает точность чисел с плавающей точкой и чем жертвуют модели – Как сжимать числа с плавающей точкой с помощью квантизации – Как измерить потерю качества модели после квантизации

    habr.com/ru/articles/1015510/

    #квантизация #LLM #bfloat16 #llamacpp #веса_модели #числа_с_плавающей_точкой #posttraining_quantization #перплексия #KLдивергенция #локальный_запуск_моделей

  3. [Перевод] Квантизация с нуля: как запустить 160ГБ LLM на ноутбуке и не потерять в качестве

    Qwen-3-Coder-Next — модель с 80 миллиардами параметров и весом 159,4 ГБ . Примерно столько RAM потребовалось бы для её запуска, и это ещё без учёта длинного контекстного окна. И эта модель не считается большой моделью! По слухам, у frontier-моделей более триллиона параметров, для которых понадобилось бы минимум 2 ТБ оперативной памяти. Последний раз я видел столько RAM в одной машине — никогда . Но что если я скажу, что можно сделать LLM в 4 раза меньше и в 2 раза быстрее — достаточно, чтобы запускать весьма мощные модели на ноутбуке, — при потере точности всего 5–10%? В этом и заключается магия квантизации. В этой статье вы узнаете: – Почему параметры модели делают её такой большой – Как работает точность чисел с плавающей точкой и чем жертвуют модели – Как сжимать числа с плавающей точкой с помощью квантизации – Как измерить потерю качества модели после квантизации

    habr.com/ru/articles/1015510/

    #квантизация #LLM #bfloat16 #llamacpp #веса_модели #числа_с_плавающей_точкой #posttraining_quantization #перплексия #KLдивергенция #локальный_запуск_моделей

  4. [Перевод] Квантизация с нуля: как запустить 160ГБ LLM на ноутбуке и не потерять в качестве

    Qwen-3-Coder-Next — модель с 80 миллиардами параметров и весом 159,4 ГБ . Примерно столько RAM потребовалось бы для её запуска, и это ещё без учёта длинного контекстного окна. И эта модель не считается большой моделью! По слухам, у frontier-моделей более триллиона параметров, для которых понадобилось бы минимум 2 ТБ оперативной памяти. Последний раз я видел столько RAM в одной машине — никогда . Но что если я скажу, что можно сделать LLM в 4 раза меньше и в 2 раза быстрее — достаточно, чтобы запускать весьма мощные модели на ноутбуке, — при потере точности всего 5–10%? В этом и заключается магия квантизации. В этой статье вы узнаете: – Почему параметры модели делают её такой большой – Как работает точность чисел с плавающей точкой и чем жертвуют модели – Как сжимать числа с плавающей точкой с помощью квантизации – Как измерить потерю качества модели после квантизации

    habr.com/ru/articles/1015510/

    #квантизация #LLM #bfloat16 #llamacpp #веса_модели #числа_с_плавающей_точкой #posttraining_quantization #перплексия #KLдивергенция #локальный_запуск_моделей

  5. Об ошибках округления и способах борьбы с ними

    Почему при сложениии одинаковых чисел в разном порядке получаются разные результаты? Как мининмизировать ошибки округления или избавиться от них совсем?

    habr.com/ru/articles/922198/

    #Вычисления #числа_с_плавающей_точкой #векторизация #параллелизм #погрешности_округления

  6. Об ошибках округления и способах борьбы с ними

    Почему при сложениии одинаковых чисел в разном порядке получаются разные результаты? Как мининмизировать ошибки округления или избавиться от них совсем?

    habr.com/ru/articles/922198/

    #Вычисления #числа_с_плавающей_точкой #векторизация #параллелизм #погрешности_округления

  7. Об ошибках округления и способах борьбы с ними

    Почему при сложениии одинаковых чисел в разном порядке получаются разные результаты? Как мининмизировать ошибки округления или избавиться от них совсем?

    habr.com/ru/articles/922198/

    #Вычисления #числа_с_плавающей_точкой #векторизация #параллелизм #погрешности_округления

  8. Быстрое приближённое умножение и деление чисел с плавающей точкой

    Особенности формата хранения чисел с плавающей точкой позволяют быстро находить приближённое значение логарифма, и, за счёт этого, выполнять умножение и деление. Результат при этом будет неточным, однако может быть применимым там, где особая точность не требуется.

    habr.com/ru/articles/906598/

    #умножение #числа_с_плавающей_точкой #числа_с_плавающей_запятой #деление #приближенные_вычисления #приближенные_алгоритмы #приближенное_умножение #приближенное_деление #быстрые_алгоритмы

  9. Быстрое приближённое умножение и деление чисел с плавающей точкой

    Особенности формата хранения чисел с плавающей точкой позволяют быстро находить приближённое значение логарифма, и, за счёт этого, выполнять умножение и деление. Результат при этом будет неточным, однако может быть применимым там, где особая точность не требуется.

    habr.com/ru/articles/906598/

    #умножение #числа_с_плавающей_точкой #числа_с_плавающей_запятой #деление #приближенные_вычисления #приближенные_алгоритмы #приближенное_умножение #приближенное_деление #быстрые_алгоритмы

  10. Быстрое приближённое умножение и деление чисел с плавающей точкой

    Особенности формата хранения чисел с плавающей точкой позволяют быстро находить приближённое значение логарифма, и, за счёт этого, выполнять умножение и деление. Результат при этом будет неточным, однако может быть применимым там, где особая точность не требуется.

    habr.com/ru/articles/906598/

    #умножение #числа_с_плавающей_точкой #числа_с_плавающей_запятой #деление #приближенные_вычисления #приближенные_алгоритмы #приближенное_умножение #приближенное_деление #быстрые_алгоритмы

  11. Быстрое приближённое умножение и деление чисел с плавающей точкой

    Особенности формата хранения чисел с плавающей точкой позволяют быстро находить приближённое значение логарифма, и, за счёт этого, выполнять умножение и деление. Результат при этом будет неточным, однако может быть применимым там, где особая точность не требуется.

    habr.com/ru/articles/906598/

    #умножение #числа_с_плавающей_точкой #числа_с_плавающей_запятой #деление #приближенные_вычисления #приближенные_алгоритмы #приближенное_умножение #приближенное_деление #быстрые_алгоритмы

  12. [Перевод] Арифметика с плавающей точкой без ошибок

    Числа с плавающей точкой (одинарной или двойной точности) печально известны за нелепые вычислительные ошибки. Здесь я описываю специальный алгоритм, который позволит их избежать

    habr.com/ru/articles/819843/

    #go #golang #числа_с_плавающей_запятой #числа_с_плавающей_точкой/запятой #числа_с_плавающей_точкой #вычисления #бенчмаркинг

  13. Система рендеринга для космического симулятора в Unity

    Несколько лет назад я работал над проектом по реализации на Unity реалистичного космического симулятора. Это достаточно нестандартное применение движка, и в ходе работы были решены разные специфические задачи, одна из которых - обеспечение корректного рендеринга объектов космических масштабов. Этим опытом я бы хотел поделиться с сообществом.

    habr.com/ru/articles/800629/

    #unity #космический_симулятор #числа_с_плавающей_точкой/запятой #рендеринг