home.social

#fp32 — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #fp32, aggregated by home.social.

  1. China’s LineShine Supercomputer To Hit 2 ExaFlops With 47,000 CPUs and Zero Reliance on Foreign Chips China has unveiled its new supercomputer, called LineShine, in Shenzen, which will deliver 2 ...

    #Featured #News #Sticky #DeepSeek #FP16 #FP32 #FP64 #Fusion #Architecture #Huawei #Kunpeng

    Origin | Interest | Match
  2. 📚🔬 Behold! Another riveting tale of matrix multiplication that promises to make your brain cells do backflips. 🤸‍♂️🎉 Multithreaded #FP32 #optimizations that require you to sacrifice your first-born to hyperparameters just to squeeze out a few extra bytes of performance. ⚙️🛠️ And if you want the actual code, here's a hint: #sgemm.c. Happy debugging! 🖥️💥
    salykova.github.io/gemm-cpu #matrixmultiplication #multithreading #debugging #HackerNews #ngated

  3. 📚🔬 Behold! Another riveting tale of matrix multiplication that promises to make your brain cells do backflips. 🤸‍♂️🎉 Multithreaded #FP32 #optimizations that require you to sacrifice your first-born to hyperparameters just to squeeze out a few extra bytes of performance. ⚙️🛠️ And if you want the actual code, here's a hint: #sgemm.c. Happy debugging! 🖥️💥
    salykova.github.io/gemm-cpu #matrixmultiplication #multithreading #debugging #HackerNews #ngated

  4. 📚🔬 Behold! Another riveting tale of matrix multiplication that promises to make your brain cells do backflips. 🤸‍♂️🎉 Multithreaded #FP32 #optimizations that require you to sacrifice your first-born to hyperparameters just to squeeze out a few extra bytes of performance. ⚙️🛠️ And if you want the actual code, here's a hint: #sgemm.c. Happy debugging! 🖥️💥
    salykova.github.io/gemm-cpu #matrixmultiplication #multithreading #debugging #HackerNews #ngated

  5. 📚🔬 Behold! Another riveting tale of matrix multiplication that promises to make your brain cells do backflips. 🤸‍♂️🎉 Multithreaded #FP32 #optimizations that require you to sacrifice your first-born to hyperparameters just to squeeze out a few extra bytes of performance. ⚙️🛠️ And if you want the actual code, here's a hint: #sgemm.c. Happy debugging! 🖥️💥
    salykova.github.io/gemm-cpu #matrixmultiplication #multithreading #debugging #HackerNews #ngated

  6. Sizing up #MI300A’s #GPU
    It’s well ahead of #Nvidia’s #H100 PCIe for just about every major category of 32- or 64-bit operations. MI300A can achieve 113.2 TFLOPS of #FP32 throughput, with each FMA counting as two floating point operations. For comparison, H100 PCIe achieved 49.3 TFLOPS in same test.
    #AMD cut down #MI300X’s GPU to create MI300A. 24 #Zen4 cores is a lot of #CPU power, and occupies one quadrant on the MI300 chip. But MI300’s main attraction is still the GPU.
    chipsandcheese.com/p/sizing-up

  7. Sizing up #MI300A’s #GPU
    It’s well ahead of #Nvidia’s #H100 PCIe for just about every major category of 32- or 64-bit operations. MI300A can achieve 113.2 TFLOPS of #FP32 throughput, with each FMA counting as two floating point operations. For comparison, H100 PCIe achieved 49.3 TFLOPS in same test.
    #AMD cut down #MI300X’s GPU to create MI300A. 24 #Zen4 cores is a lot of #CPU power, and occupies one quadrant on the MI300 chip. But MI300’s main attraction is still the GPU.
    chipsandcheese.com/p/sizing-up

  8. Sizing up ’s
    It’s well ahead of ’s PCIe for just about every major category of 32- or 64-bit operations. MI300A can achieve 113.2 TFLOPS of throughput, with each FMA counting as two floating point operations. For comparison, H100 PCIe achieved 49.3 TFLOPS in same test.
    cut down ’s GPU to create MI300A. 24 cores is a lot of power, and occupies one quadrant on the MI300 chip. But MI300’s main attraction is still the GPU.
    chipsandcheese.com/p/sizing-up

  9. Sizing up #MI300A’s #GPU
    It’s well ahead of #Nvidia’s #H100 PCIe for just about every major category of 32- or 64-bit operations. MI300A can achieve 113.2 TFLOPS of #FP32 throughput, with each FMA counting as two floating point operations. For comparison, H100 PCIe achieved 49.3 TFLOPS in same test.
    #AMD cut down #MI300X’s GPU to create MI300A. 24 #Zen4 cores is a lot of #CPU power, and occupies one quadrant on the MI300 chip. But MI300’s main attraction is still the GPU.
    chipsandcheese.com/p/sizing-up

  10. Sizing up #MI300A’s #GPU
    It’s well ahead of #Nvidia’s #H100 PCIe for just about every major category of 32- or 64-bit operations. MI300A can achieve 113.2 TFLOPS of #FP32 throughput, with each FMA counting as two floating point operations. For comparison, H100 PCIe achieved 49.3 TFLOPS in same test.
    #AMD cut down #MI300X’s GPU to create MI300A. 24 #Zen4 cores is a lot of #CPU power, and occupies one quadrant on the MI300 chip. But MI300’s main attraction is still the GPU.
    chipsandcheese.com/p/sizing-up

  11. FP32, FP16, BF16 и FP8 — разбираемся в основных типах чисел с плавающей запятой

    Привет, Хабр! Сегодня давайте поговорим о том, как современные вычисления на GPU стали более гибкими и эффективными благодаря различным форматам чисел с плавающей запятой ( FP64 , FP32 , FP16 , BFLOAT16 и FP8 ). Эти форматы не просто числа — за каждым из них стоит конкретная область применения. В разных ситуациях мы сталкиваемся с задачами, где важны либо скорость, либо точность, и правильно выбранный тип floating point помогает оптимизировать ресурсы. Давайте разберём всё это на примерах и поймём, в каких задачах каждый из этих форматов будет наиболее полезен.

    habr.com/ru/companies/serverfl

    #FP16 #fp32 #FP64 #BF16 #floating_point #плавающая_запятая #fp8 #числа_с_плавающей_запятой #формат_с_плавающей_запятой

  12. FP32, FP16, BF16 и FP8 — разбираемся в основных типах чисел с плавающей запятой

    Привет, Хабр! Сегодня давайте поговорим о том, как современные вычисления на GPU стали более гибкими и эффективными благодаря различным форматам чисел с плавающей запятой ( FP64 , FP32 , FP16 , BFLOAT16 и FP8 ). Эти форматы не просто числа — за каждым из них стоит конкретная область применения. В разных ситуациях мы сталкиваемся с задачами, где важны либо скорость, либо точность, и правильно выбранный тип floating point помогает оптимизировать ресурсы. Давайте разберём всё это на примерах и поймём, в каких задачах каждый из этих форматов будет наиболее полезен.

    habr.com/ru/companies/serverfl

    #FP16 #fp32 #FP64 #BF16 #floating_point #плавающая_запятая #fp8 #числа_с_плавающей_запятой #формат_с_плавающей_запятой

  13. FP32, FP16, BF16 и FP8 — разбираемся в основных типах чисел с плавающей запятой

    Привет, Хабр! Сегодня давайте поговорим о том, как современные вычисления на GPU стали более гибкими и эффективными благодаря различным форматам чисел с плавающей запятой ( FP64 , FP32 , FP16 , BFLOAT16 и FP8 ). Эти форматы не просто числа — за каждым из них стоит конкретная область применения. В разных ситуациях мы сталкиваемся с задачами, где важны либо скорость, либо точность, и правильно выбранный тип floating point помогает оптимизировать ресурсы. Давайте разберём всё это на примерах и поймём, в каких задачах каждый из этих форматов будет наиболее полезен.

    habr.com/ru/companies/serverfl

    #FP16 #fp32 #FP64 #BF16 #floating_point #плавающая_запятая #fp8 #числа_с_плавающей_запятой #формат_с_плавающей_запятой

  14. Малые числа, большие возможности: как плавающая запятая ускоряет ИИ и технологии

    Привет, Хабр! С вами снова ServerFlow, и сегодня мы решили погрузиться в увлекательный мир чисел с плавающей запятой . Вы когда-нибудь задумывались, почему существуют разные виды этих чисел и как они влияют на производительность наших процессоров и видеокарт? Как малые числа с плавающей запятой помогают развивать нейросети и искусственный интеллект? Давайте вместе разберемся в этих вопросах, раскроем тайны стандарта IEEE 754 и узнаем, какое значение имеют большие и маленькие числа с плавающей запятой в современных вычислениях.

    habr.com/ru/companies/serverfl

    #плавающая_запятая #fp32 #fp16 #INT8 #квантизация #Тензорные_ядра #fpu #floatingpoint #floating_point #ieee_754

  15. Малые числа, большие возможности: как плавающая запятая ускоряет ИИ и технологии

    Привет, Хабр! С вами снова ServerFlow, и сегодня мы решили погрузиться в увлекательный мир чисел с плавающей запятой . Вы когда-нибудь задумывались, почему существуют разные виды этих чисел и как они влияют на производительность наших процессоров и видеокарт? Как малые числа с плавающей запятой помогают развивать нейросети и искусственный интеллект? Давайте вместе разберемся в этих вопросах, раскроем тайны стандарта IEEE 754 и узнаем, какое значение имеют большие и маленькие числа с плавающей запятой в современных вычислениях.

    habr.com/ru/companies/serverfl

    #плавающая_запятая #fp32 #fp16 #INT8 #квантизация #Тензорные_ядра #fpu #floatingpoint #floating_point #ieee_754

  16. Малые числа, большие возможности: как плавающая запятая ускоряет ИИ и технологии

    Привет, Хабр! С вами снова ServerFlow, и сегодня мы решили погрузиться в увлекательный мир чисел с плавающей запятой . Вы когда-нибудь задумывались, почему существуют разные виды этих чисел и как они влияют на производительность наших процессоров и видеокарт? Как малые числа с плавающей запятой помогают развивать нейросети и искусственный интеллект? Давайте вместе разберемся в этих вопросах, раскроем тайны стандарта IEEE 754 и узнаем, какое значение имеют большие и маленькие числа с плавающей запятой в современных вычислениях.

    habr.com/ru/companies/serverfl

    #плавающая_запятая #fp32 #fp16 #INT8 #квантизация #Тензорные_ядра #fpu #floatingpoint #floating_point #ieee_754