home.social

#fpu — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #fpu, aggregated by home.social.

  1. MC68881 VHDL: FPGA implementation of the Motorola FPU

    Matthew Pearce is working on an open-source reimplementation of the Motorola 68881 floating-point unit. Until now, FPGA-68k systems have relied on software emulation, stubs or behavioral shortcuts that cannot reproduce the actual FPU behavior. The reconstruction of the MC68881 in VHDL is intended to close this gap:

    amiga-news.de/en/news/AN-2026-

  2. [Перевод] Реверс-инжиниринг π: как Pentium считал синусы быстрее всех

    Pentium часто вспоминают из-за FDIV, но куда интереснее его «внутренний тригонометр». В этой статье — разбор FPU под микроскопом: как в constant ROM закодированы сотни коэффициентов и табличных констант, почему Intel отказалась от CORDIC в пользу полиномиальных аппроксимаций с редукцией диапазона, и как (вероятно) подбирались коэффициенты через минимакс (алгоритм Ремеза). Поговорим про компоновку ячеек ROM, BiCMOS-драйверы строк, микрокод и datapath, где биты реально встречаются с математикой. По сути — практическая археология кремния: от побитовых «полосок» на кристалле до инженерных компромиссов точности и латентности, которые сделали синус и логарифм быстрыми «на железе». Полный разбор

    habr.com/ru/companies/otus/art

    #Pentium #FPU #алгоритм_Ремеза #редукция_диапазона #микрокод #BiCMOS #Микроэлектроника #архитектура_компьютеров #Реверсинжиниринг #CORDIC

  3. [Перевод] Два бита на транзистор: ПЗУ микрокода повышенной плотности в FPU-сопроцессоре Intel 8087

    Чип 8087 обеспечивал быстрые вычисления с плавающей запятой для первого IBM PC и со временем стал частью x86-архитектуры, используемой и сегодня. Одна необычная особенность 8087 — многоуровневое ПЗУ, где каждая ячейка кодировала два бита, что давало плотность примерно вдвое выше обычного ПЗУ. Вместо хранения двоичных данных каждая ячейка ПЗУ 8087 хранила одно из четырёх уровневых значений, которое затем декодировалось в два двоичных бита. Поскольку 8087 требовалось большое ПЗУ микрокода, а сам чип уже упирался в пределы по числу транзисторов для размещения на кристалле, Intel применил этот специальный приём, чтобы ПЗУ «влезло». В этой статье я объясню, как Intel реализовал это многоуровневое ПЗУ. Разобрать 8087

    habr.com/ru/companies/otus/art

    #микрофотографии_кристалла #компаратор #ПЗУ #микрокод #многоуровневая_память #FPU #сопроцессор #NMOS #Intel_8087

  4. Малые числа, большие возможности: как плавающая запятая ускоряет ИИ и технологии

    Привет, Хабр! С вами снова ServerFlow, и сегодня мы решили погрузиться в увлекательный мир чисел с плавающей запятой . Вы когда-нибудь задумывались, почему существуют разные виды этих чисел и как они влияют на производительность наших процессоров и видеокарт? Как малые числа с плавающей запятой помогают развивать нейросети и искусственный интеллект? Давайте вместе разберемся в этих вопросах, раскроем тайны стандарта IEEE 754 и узнаем, какое значение имеют большие и маленькие числа с плавающей запятой в современных вычислениях.

    habr.com/ru/companies/serverfl

    #плавающая_запятая #fp32 #fp16 #INT8 #квантизация #Тензорные_ядра #fpu #floatingpoint #floating_point #ieee_754

  5. In today's riveting snooze-fest, we're treated to an epic saga on the XiangShan Vector Floating-Point Unit, a tale so dense it could sink ships ⚓. This document is the perfect cure for insomnia, unless you're a CPU looking to spice up its love life with... abstract module fetches 🤖💤.
    docs.xiangshan.cc/projects/des #XiangShanVector #FPU #TechTales #CPUInsomnia #AbstractModules #HackerNews #ngated

  6. My #Sega #Dreamcast #programming #book is divided into 4 volumes, each covering a major area of discussion. The first volume is "Foundational knowledge," stuff not strictly about the Dreamcast, but things relevant. I.e. Matrix math, or bits and bytes. So when we're talking later about bitpacking an #FPU register to transform #polygon #vertices, people aren't lost. This was one of the hardest parts of the entire book to write, but it's finally "done" and ready:

    It wound up being 122 pages long.

  7. Как бороться с использованием ChatGPT студентами

    Студенты обожают ChatGPT. В идеале, они хотят закоротить профессора и чатгопоту напрямую, то есть посылать задачу от профессора гопоте, пересылать ответ профессору, возражения слать гопоте назад итд - пока не получится решения. Лучше всего это делать скриптом, чтобы студент вообще не был вовлечен в решение задачи и занимался своими студенческими делами, пока чатгопота и профессор разговаривают. Как же обломать крылья этой мечте?

    habr.com/ru/articles/902400/

    #ChatGPT #Verilog #SystemVerilog #интервью #школа_синтеза_цифровых_схем #LLM #open_source #cheating #собеседования_задачи #fpu

  8. The Pentium Processor’s Innovative (and Complicated) Method of Multiplying by Three, Fast - [Ken Shirriff] has been sharing a really low-level look at Intel’s Pentium (1993) ... - hackaday.com/2025/03/08/the-pe #reverseengineering #retrocomputing #pentium #radix-8 #fpu

  9. Самые Эпичные Баги при Программировании Микроконтроллеров

    У каждого программиста микроконтроллеров с годами кристаллизируется коллекция золотых багов . Некоторые из них весьма эпичные. Самый типичный баг - это зависание прошивки. Выявление причин багов и их устранение порой сродни работы детективом. Это проявляется в том, что порой очень трудно выявить причину бага. Сначала разработчик идет по ложному следу, ходит кругами, а в конце-концов выясняется, что причина на самом деле была проста, как солдатский валенок.

    habr.com/ru/articles/884100/

    #ISR #fpu #sprintf #LoRa #hardfault

  10. [Перевод] Ни одна реализация элементарных функций не соответствует стандарту IEEE 754

    Введённый в 1985 году стандарт IEEE-754 для чисел с плавающей запятой был предназначен для решения проблемы разнородности реализаций чисел с плавающей запятой, мешавших портируемости кода, а также для повышения стабильности между платформами. Он получил широкое применение и многократно пересматривался в течение прошедших лет. Если вы когда-нибудь работали с любыми вещественными числами в своих приложениях, то они, вероятно, отвечали этому стандарту. Моя работа в течение последнего года заключалась в анализе погрешности различных математических функций, накопления этой погрешности и способов её уменьшения при помощи различных программных паттернов. Одной из исследованных мной тем были базовые математические функции, используемые в функциях активации нейронных сетей, а также способы их аппроксимации для повышения производительности . В процессе работы нам пришлось столкнуться с противодействием со стороны людей, активно стремящихся к корректной реализации математических функций и к соответствию их стандартам, в частности, к соблюдению обеспечения корректности одной наименее значимой единицы измерения (unit in last place, ULP) для элементарных функций. Я был заинтересован в дальнейшей работе по аппроксимации этих функций, поэтому приступил к исследованию того, каким образом они гарантируют корректность, и если они корректны только на 1 ULP, то где располагаются ошибки в области определения функции. В процессе изучения я обнаружил, что ни одна из популярных математических библиотек, используемых во множестве сфер вычислений, на самом деле не выполняет корректное округление в соответствии с требованиями любой версии IEEE 754 после первой редакции 1985 года.

    habr.com/ru/companies/ruvds/ar

    #числа_с_плавающей_запятой #floating_point #ieee_754 #плавающая_запятая #плавающая_точка #погрешности_округления #fpu #ruvds_статьи

  11. Повышение эффективности образования методом «Безумного Макса», в применении для хардвера высокоскоростных вычислений

    Когда студент устраивается на работу в электронную компанию, очень здорово, если он уже умеет строить одну и ту же электронную схему разными способами, в зависимости от требований пропускной способности, максимальной тактовой частоты, размера и энергопотребления. Как натренировать такое умение? Для новых домашних работ в программе Школы Синтеза Цифровых Схем мы решили разодрать на блоки реальный процессор и дать студентам задачу собирать разные специализированные вычислительные устройства из этих блоков, примерно как герои фильма "Безумный Макс: Дорога ярости" собирали свои боевые драндулеты из частей реальных автомобилей. В качестве первой жертвы мы выбрали ...

    habr.com/ru/articles/862734/

    #Verilog #VHDL #микроархитектура #riscv #FPU #ieee754 #SystemVerilog #школа_синтеза_цифровых_схем #openhwgroup #образование

  12. AMD Zen 5 Execution Engine Leaked, Features True 512-bit FPU

    Giving "Zen 5" a 512-bit FPU meant that AMD also had to scale up the ancillaries [..]. The L1 Data cache has been doubled in bandwidth, and increased in size by 50%. The L1D is now 48 KB in size [..]. FPU MADD latency has been reduced by 1 cycle. Besides the FPU, AMD also increased the number of Integer execution pipes to 10, from 8 on "Zen 4."

    techpowerup.com/321201/amd-zen

    #AMD #Zen5 #CPU #FPU #AVX512 #Microarchitecture

  13. The cool part about my #research is that, the model is a 512 instruction program for #FPU. Not a full blown neural network which requires tons of computations.

    #neural_network #NN #ANN #RNN #CNN

  14. Ich versuche meine Artikel immer etwas "anzureichern", so dass auch Fortgeschrittene etwas davon haben.
    In diesem "Cheatsheet"-Artikel über #Winkel und #Steigung gibt es am Ende auch ein kleines Demo wie man #Assembler-Code und #FPU-Befehle in C-Programme einbettet.

    dd3ah.de/winkel-und-steigung/

  15. 昨天聊了單卡多 #GPU 今天則來聊聊多 #CPU 的系統
    在過去
    如何將大量的電晶體在同時思考供電、散熱以及成本等多重考量下封裝在小小的一塊板子上
    是非常大的難題

    部分廠商索性不考慮成本
    像是當年的 #IBM #Power 系列
    或許當時許多的工作站、伺服器廠商
    因為這些客群對於預算敏感度相對較低
    所以可以這樣做

    但是在 #PC 端這樣就行不通了
    所以在單一晶片的效能無法有效的提升下
    想到的辦法就是「為何不裝兩個呢?」
    這張 #ABIT #BP6 就是這樣的產物

    這張主機板允許當時的 Celeron CPU 以雙 CPU 的方式運作
    讓你能夠用相對低廉的成本
    獲得"雙核心"的效能
    這算是雙CPU系統進入家用的鼻祖吧
    (如果 CPU + #FPU 的組合不算的話)
    也是少數出現在中階市場
    intel 過去也曾推出過 #C2Q Extreme 雙771 的系統
    但那就是作為相當於旗艦系統的存在了

    #Allen講看看 #retro
    #台灣Vtuber #Vtubers #Vtuber #Taiwan

  16. 今天想要分享的事可能很少人知道東西:Co-processoer #協同處理器 或是 #FPU #浮點運算處理器

    在微處理器剛面世時
    他是只能做整數運算的
    並不像當代的 CPU
    除了浮點運算不說
    還有顯示晶片、AI處理器等等
    早期的 CPU 是都沒有的
    所有的"其他功能"都必須依靠介面卡來協助
    甚至在某個階段 L2 Cache 也是放在主機板上的
    因此當年的晶片組跟主機板的設計就會讓同一套系統有天壤之別的表現

    當然網路上已經不乏一些 CPU 或早期顯示晶片的考古介紹
    但協同處理器或是浮點運算處理器的考古卻相對稀少
    多數就是介紹 intel 自家的 i387/i487

    這部影片介紹了 #Weitek #微技 公司的協同處理器
    這家公司網路上的中文資料不多
    維基百科條目大概是最完整的
    但很有意思的是這家公司除了是台灣人創立的以外
    他主要業務就是設計協同處理器
    並且在協同處理器慢慢退市時
    這家公司也迅速地消失在市場上

    youtu.be/cQ4GAiVPXN0

    #Allen講看看 #retro
    #台灣Vtuber #Vtubers #Vtuber #Taiwan

  17. How about we make this #FloatingPointFriday? Here's a gem I posted in another thread and that I regularly use to scare my students and to demonstrate to them the dangers of #floatingPoint. Every #IEEE 754 compliant #FPU will give the same answer. It allows me to talk about the fact that radix representations of a number may be finite in one base (10) and infinite in another (2). Then I throw in the fact that floating point numbers have #finitePrecision and that #machineEpsilon is a thing.

  18. @matthew_d_green I like to scare my students with the this little gem (and then I explain to them that every computer with an #IEEE 754 compliant #FPU will give you the same answer, and for a very good reason)

    #FloatingPoint #IEEE754 #STEM

  19. #30DaySongChallenge day 07: a song to drive to

    i have two very specific playlists for this, and it was difficult to narrow it down to one track. however, if you’re ever in miami with your testarossa, this is the one, in this version.

    FPU – crockett’s theme
    songwhip.com/fpu/crocketts-the #FPU #electro #miamiVice

  20. Home-Built CPU Runs With Home-Built Toolchain - A few years ago [Takaya Saeki] and fellow students of the University of Tokyo, wer... - hackaday.com/2022/11/22/home-b #computerhacks #custom #risc #cpu #fpu #isa

  21. Ein Wissenschaftler einer New Yorker Universität hat festgestellt, dass es bei einigen Python-Paketen zu Problemen mit nummerischen Berechnungen kommen kann.
    Python: Compiler-Optionen können bei Gleitkommaberechnungen zu Fehlern führen
  22. AMD Zen 5 Execution Engine Leaked, Features True 512-bit FPU

    Giving "Zen 5" a 512-bit FPU meant that AMD also had to scale up the ancillaries [..]. The L1 Data cache has been doubled in bandwidth, and increased in size by 50%. The L1D is now 48 KB in size [..]. FPU MADD latency has been reduced by 1 cycle. Besides the FPU, AMD also increased the number of Integer execution pipes to 10, from 8 on "Zen 4."

    techpowerup.com/321201/amd-zen

    #AMD #Zen5 #CPU #FPU #AVX512 #Microarchitecture

  23. Малые числа, большие возможности: как плавающая запятая ускоряет ИИ и технологии

    Привет, Хабр! С вами снова ServerFlow, и сегодня мы решили погрузиться в увлекательный мир чисел с плавающей запятой . Вы когда-нибудь задумывались, почему существуют разные виды этих чисел и как они влияют на производительность наших процессоров и видеокарт? Как малые числа с плавающей запятой помогают развивать нейросети и искусственный интеллект? Давайте вместе разберемся в этих вопросах, раскроем тайны стандарта IEEE 754 и узнаем, какое значение имеют большие и маленькие числа с плавающей запятой в современных вычислениях.

    habr.com/ru/companies/serverfl

    #плавающая_запятая #fp32 #fp16 #INT8 #квантизация #Тензорные_ядра #fpu #floatingpoint #floating_point #ieee_754

  24. Малые числа, большие возможности: как плавающая запятая ускоряет ИИ и технологии

    Привет, Хабр! С вами снова ServerFlow, и сегодня мы решили погрузиться в увлекательный мир чисел с плавающей запятой . Вы когда-нибудь задумывались, почему существуют разные виды этих чисел и как они влияют на производительность наших процессоров и видеокарт? Как малые числа с плавающей запятой помогают развивать нейросети и искусственный интеллект? Давайте вместе разберемся в этих вопросах, раскроем тайны стандарта IEEE 754 и узнаем, какое значение имеют большие и маленькие числа с плавающей запятой в современных вычислениях.

    habr.com/ru/companies/serverfl

    #плавающая_запятая #fp32 #fp16 #INT8 #квантизация #Тензорные_ядра #fpu #floatingpoint #floating_point #ieee_754

  25. In today's riveting snooze-fest, we're treated to an epic saga on the XiangShan Vector Floating-Point Unit, a tale so dense it could sink ships ⚓. This document is the perfect cure for insomnia, unless you're a CPU looking to spice up its love life with... abstract module fetches 🤖💤.
    docs.xiangshan.cc/projects/des #XiangShanVector #FPU #TechTales #CPUInsomnia #AbstractModules #HackerNews #ngated

  26. In today's riveting snooze-fest, we're treated to an epic saga on the XiangShan Vector Floating-Point Unit, a tale so dense it could sink ships ⚓. This document is the perfect cure for insomnia, unless you're a CPU looking to spice up its love life with... abstract module fetches 🤖💤.
    docs.xiangshan.cc/projects/des #XiangShanVector #FPU #TechTales #CPUInsomnia #AbstractModules #HackerNews #ngated

  27. In today's riveting snooze-fest, we're treated to an epic saga on the XiangShan Vector Floating-Point Unit, a tale so dense it could sink ships ⚓. This document is the perfect cure for insomnia, unless you're a CPU looking to spice up its love life with... abstract module fetches 🤖💤.
    docs.xiangshan.cc/projects/des #XiangShanVector #FPU #TechTales #CPUInsomnia #AbstractModules #HackerNews #ngated

  28. [Перевод] Два бита на транзистор: ПЗУ микрокода повышенной плотности в FPU-сопроцессоре Intel 8087

    Чип 8087 обеспечивал быстрые вычисления с плавающей запятой для первого IBM PC и со временем стал частью x86-архитектуры, используемой и сегодня. Одна необычная особенность 8087 — многоуровневое ПЗУ, где каждая ячейка кодировала два бита, что давало плотность примерно вдвое выше обычного ПЗУ. Вместо хранения двоичных данных каждая ячейка ПЗУ 8087 хранила одно из четырёх уровневых значений, которое затем декодировалось в два двоичных бита. Поскольку 8087 требовалось большое ПЗУ микрокода, а сам чип уже упирался в пределы по числу транзисторов для размещения на кристалле, Intel применил этот специальный приём, чтобы ПЗУ «влезло». В этой статье я объясню, как Intel реализовал это многоуровневое ПЗУ. Разобрать 8087

    habr.com/ru/companies/otus/art

    #микрофотографии_кристалла #компаратор #ПЗУ #микрокод #многоуровневая_память #FPU #сопроцессор #NMOS #Intel_8087

  29. [Перевод] Два бита на транзистор: ПЗУ микрокода повышенной плотности в FPU-сопроцессоре Intel 8087

    Чип 8087 обеспечивал быстрые вычисления с плавающей запятой для первого IBM PC и со временем стал частью x86-архитектуры, используемой и сегодня. Одна необычная особенность 8087 — многоуровневое ПЗУ, где каждая ячейка кодировала два бита, что давало плотность примерно вдвое выше обычного ПЗУ. Вместо хранения двоичных данных каждая ячейка ПЗУ 8087 хранила одно из четырёх уровневых значений, которое затем декодировалось в два двоичных бита. Поскольку 8087 требовалось большое ПЗУ микрокода, а сам чип уже упирался в пределы по числу транзисторов для размещения на кристалле, Intel применил этот специальный приём, чтобы ПЗУ «влезло». В этой статье я объясню, как Intel реализовал это многоуровневое ПЗУ. Разобрать 8087

    habr.com/ru/companies/otus/art

    #микрофотографии_кристалла #компаратор #ПЗУ #микрокод #многоуровневая_память #FPU #сопроцессор #NMOS #Intel_8087

  30. [Перевод] Два бита на транзистор: ПЗУ микрокода повышенной плотности в FPU-сопроцессоре Intel 8087

    Чип 8087 обеспечивал быстрые вычисления с плавающей запятой для первого IBM PC и со временем стал частью x86-архитектуры, используемой и сегодня. Одна необычная особенность 8087 — многоуровневое ПЗУ, где каждая ячейка кодировала два бита, что давало плотность примерно вдвое выше обычного ПЗУ. Вместо хранения двоичных данных каждая ячейка ПЗУ 8087 хранила одно из четырёх уровневых значений, которое затем декодировалось в два двоичных бита. Поскольку 8087 требовалось большое ПЗУ микрокода, а сам чип уже упирался в пределы по числу транзисторов для размещения на кристалле, Intel применил этот специальный приём, чтобы ПЗУ «влезло». В этой статье я объясню, как Intel реализовал это многоуровневое ПЗУ. Разобрать 8087

    habr.com/ru/companies/otus/art

    #микрофотографии_кристалла #компаратор #ПЗУ #микрокод #многоуровневая_память #FPU #сопроцессор #NMOS #Intel_8087

  31. Ein Wissenschaftler einer New Yorker Universität hat festgestellt, dass es bei einigen Python-Paketen zu Problemen mit nummerischen Berechnungen kommen kann.
    Python: Compiler-Optionen können bei Gleitkommaberechnungen zu Fehlern führen
  32. [Перевод] Реверс-инжиниринг π: как Pentium считал синусы быстрее всех

    Pentium часто вспоминают из-за FDIV, но куда интереснее его «внутренний тригонометр». В этой статье — разбор FPU под микроскопом: как в constant ROM закодированы сотни коэффициентов и табличных констант, почему Intel отказалась от CORDIC в пользу полиномиальных аппроксимаций с редукцией диапазона, и как (вероятно) подбирались коэффициенты через минимакс (алгоритм Ремеза). Поговорим про компоновку ячеек ROM, BiCMOS-драйверы строк, микрокод и datapath, где биты реально встречаются с математикой. По сути — практическая археология кремния: от побитовых «полосок» на кристалле до инженерных компромиссов точности и латентности, которые сделали синус и логарифм быстрыми «на железе». Полный разбор

    habr.com/ru/companies/otus/art

    #Pentium #FPU #алгоритм_Ремеза #редукция_диапазона #микрокод #BiCMOS #Микроэлектроника #архитектура_компьютеров #Реверсинжиниринг #CORDIC

  33. [Перевод] Реверс-инжиниринг π: как Pentium считал синусы быстрее всех

    Pentium часто вспоминают из-за FDIV, но куда интереснее его «внутренний тригонометр». В этой статье — разбор FPU под микроскопом: как в constant ROM закодированы сотни коэффициентов и табличных констант, почему Intel отказалась от CORDIC в пользу полиномиальных аппроксимаций с редукцией диапазона, и как (вероятно) подбирались коэффициенты через минимакс (алгоритм Ремеза). Поговорим про компоновку ячеек ROM, BiCMOS-драйверы строк, микрокод и datapath, где биты реально встречаются с математикой. По сути — практическая археология кремния: от побитовых «полосок» на кристалле до инженерных компромиссов точности и латентности, которые сделали синус и логарифм быстрыми «на железе». Полный разбор

    habr.com/ru/companies/otus/art

    #Pentium #FPU #алгоритм_Ремеза #редукция_диапазона #микрокод #BiCMOS #Микроэлектроника #архитектура_компьютеров #Реверсинжиниринг #CORDIC

  34. [Перевод] Реверс-инжиниринг π: как Pentium считал синусы быстрее всех

    Pentium часто вспоминают из-за FDIV, но куда интереснее его «внутренний тригонометр». В этой статье — разбор FPU под микроскопом: как в constant ROM закодированы сотни коэффициентов и табличных констант, почему Intel отказалась от CORDIC в пользу полиномиальных аппроксимаций с редукцией диапазона, и как (вероятно) подбирались коэффициенты через минимакс (алгоритм Ремеза). Поговорим про компоновку ячеек ROM, BiCMOS-драйверы строк, микрокод и datapath, где биты реально встречаются с математикой. По сути — практическая археология кремния: от побитовых «полосок» на кристалле до инженерных компромиссов точности и латентности, которые сделали синус и логарифм быстрыми «на железе». Полный разбор

    habr.com/ru/companies/otus/art

    #Pentium #FPU #алгоритм_Ремеза #редукция_диапазона #микрокод #BiCMOS #Микроэлектроника #архитектура_компьютеров #Реверсинжиниринг #CORDIC