home.social

#микроархитектура — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #микроархитектура, aggregated by home.social.

  1. Как одна буква в ассемблере стоит 3× производительности

    Я хочу показать вам, как одна буква в ассемблере может стоить 3× производительности. Не в теории — на живых замерах. По дороге мы заглянем внутрь процессора: Register Alias Table, partial register merge, scheduler, latency vs throughput, и даже обнаружим, что делитель выдаёт остаток раньше частного. Но начнём с основ. Приготовьтесь: кроличья нора окажется глубже, чем кажется.

    habr.com/ru/articles/1024862/

    #x86 #assembly #NASM #div #partial_register_merge #latency #throughput #микроархитектура #Skylake #оптимизация

  2. Как одна буква в ассемблере стоит 3× производительности

    Я хочу показать вам, как одна буква в ассемблере может стоить 3× производительности. Не в теории — на живых замерах. По дороге мы заглянем внутрь процессора: Register Alias Table, partial register merge, scheduler, latency vs throughput, и даже обнаружим, что делитель выдаёт остаток раньше частного. Но начнём с основ. Приготовьтесь: кроличья нора окажется глубже, чем кажется.

    habr.com/ru/articles/1024862/

    #x86 #assembly #NASM #div #partial_register_merge #latency #throughput #микроархитектура #Skylake #оптимизация

  3. Как одна буква в ассемблере стоит 3× производительности

    Я хочу показать вам, как одна буква в ассемблере может стоить 3× производительности. Не в теории — на живых замерах. По дороге мы заглянем внутрь процессора: Register Alias Table, partial register merge, scheduler, latency vs throughput, и даже обнаружим, что делитель выдаёт остаток раньше частного. Но начнём с основ. Приготовьтесь: кроличья нора окажется глубже, чем кажется.

    habr.com/ru/articles/1024862/

    #x86 #assembly #NASM #div #partial_register_merge #latency #throughput #микроархитектура #Skylake #оптимизация

  4. Как одна буква в ассемблере стоит 3× производительности

    Я хочу показать вам, как одна буква в ассемблере может стоить 3× производительности. Не в теории — на живых замерах. По дороге мы заглянем внутрь процессора: Register Alias Table, partial register merge, scheduler, latency vs throughput, и даже обнаружим, что делитель выдаёт остаток раньше частного. Но начнём с основ. Приготовьтесь: кроличья нора окажется глубже, чем кажется.

    habr.com/ru/articles/1024862/

    #x86 #assembly #NASM #div #partial_register_merge #latency #throughput #микроархитектура #Skylake #оптимизация

  5. [Перевод] Реверс-инжиниринг АЛУ процессора 8086 по фотографиям кристалла

    Как устроено арифметико-логическое устройство процессора, если смотреть не на блок-схемы из учебников, а на сам кристалл? В этой статье — очередной захватывающий разбор АЛУ Intel 8086 через реверс-инжиниринг от Ken Shirriff: от фотографий кремния до понимания, как реализованы перенос, логические операции и сдвиги на уровне транзисторов. По ходу станет видно, какие инженерные компромиссы стояли за архитектурой и почему даже базовые операции в реальном железе устроены сложнее, чем кажется по спецификации. Вглубь процессора

    habr.com/ru/companies/otus/art

    #реверсинжиниринг #intel_8086 #алу #арифметикологическое_устройство #схемотехника #транзисторы_NMOS #микроархитектура #кремниевый_кристалл #мультиплексор

  6. [Перевод] Реверс-инжиниринг АЛУ процессора 8086 по фотографиям кристалла

    Как устроено арифметико-логическое устройство процессора, если смотреть не на блок-схемы из учебников, а на сам кристалл? В этой статье — очередной захватывающий разбор АЛУ Intel 8086 через реверс-инжиниринг от Ken Shirriff: от фотографий кремния до понимания, как реализованы перенос, логические операции и сдвиги на уровне транзисторов. По ходу станет видно, какие инженерные компромиссы стояли за архитектурой и почему даже базовые операции в реальном железе устроены сложнее, чем кажется по спецификации. Вглубь процессора

    habr.com/ru/companies/otus/art

    #реверсинжиниринг #intel_8086 #алу #арифметикологическое_устройство #схемотехника #транзисторы_NMOS #микроархитектура #кремниевый_кристалл #мультиплексор

  7. [Перевод] Реверс-инжиниринг АЛУ процессора 8086 по фотографиям кристалла

    Как устроено арифметико-логическое устройство процессора, если смотреть не на блок-схемы из учебников, а на сам кристалл? В этой статье — очередной захватывающий разбор АЛУ Intel 8086 через реверс-инжиниринг от Ken Shirriff: от фотографий кремния до понимания, как реализованы перенос, логические операции и сдвиги на уровне транзисторов. По ходу станет видно, какие инженерные компромиссы стояли за архитектурой и почему даже базовые операции в реальном железе устроены сложнее, чем кажется по спецификации. Вглубь процессора

    habr.com/ru/companies/otus/art

    #реверсинжиниринг #intel_8086 #алу #арифметикологическое_устройство #схемотехника #транзисторы_NMOS #микроархитектура #кремниевый_кристалл #мультиплексор

  8. [Перевод] Реверс-инжиниринг АЛУ процессора 8086 по фотографиям кристалла

    Как устроено арифметико-логическое устройство процессора, если смотреть не на блок-схемы из учебников, а на сам кристалл? В этой статье — очередной захватывающий разбор АЛУ Intel 8086 через реверс-инжиниринг от Ken Shirriff: от фотографий кремния до понимания, как реализованы перенос, логические операции и сдвиги на уровне транзисторов. По ходу станет видно, какие инженерные компромиссы стояли за архитектурой и почему даже базовые операции в реальном железе устроены сложнее, чем кажется по спецификации. Вглубь процессора

    habr.com/ru/companies/otus/art

    #реверсинжиниринг #intel_8086 #алу #арифметикологическое_устройство #схемотехника #транзисторы_NMOS #микроархитектура #кремниевый_кристалл #мультиплексор

  9. Как китайцы убили x86, ARM и создали своё — детектив Восточном экспрессе

    Привет, постоянные и не очень читатели! Пора вернуться к моим любимым архитектурам, процессорам, техпроцессам и всему причастному. Это седьмой и САМЫЙ масштабный материал из цикла (и, вероятно, во всём Рунете) про китайские ISA, микроархитектуры и микроэлектронику. Что было раньше: Part I : Скандальное разоблачение x86: ARM врывается с двух ног (58K, +61, 160 комментариев) Part II : Этой индустрии нужен новый герой: ARM врывается с двух ног Part III : Китайский киднэппинг: похищение дочки Part IV : RISC‑V — звезда родилась: x86 не у дел, ARM сломала две ноги (67K, +64, 207 комментариев) Part V : Смерть GPU/CPU на транзисторах — архитектура квантовых компьютеров Part VI : У VLIW длиннее x86: Itanium в шаге от величества, Эльбрус — подержите моё пиво, тайны PS2 Part VII: Как китайцы x86 и ARM убили и создали своё — детектив в Восточном экспрессе ← ВЫ ЗДЕСЬ Part VIII — ██████████████. В этом лонгриде я расскажу вам всё о серверных процессорах из Поднебесной на всех ключевых архитектурах: ARM (Huawei), x86 (Zhaoxin), RISC-V (T-Head) и LoongArch (Loongson). Будет и про строящиеся мегафабрики Huawei, и про создание независимой ISA (как наш Эльбрус, но с конкурентными продуктами и производством), и про китайские лицензированные x86-процессоры, и про многое другое. Бонусом в каждом разделе распишу интересные факты про иероглифы в названиях компаний и их продуктах (символизм в китайской культуре). Например, вы узнаете, как компания Медоед куёт свои процессоры из легендарной стали (образно), чтобы бесстрашно сражаться с западными техногигантами (буквально). И это не шутка, а оммаж на мемы про медоедов . Дамы и господа — Восточный экспресс готов к посадке. Пожалуйста, позвольте стюарду проводить вас к личному купе. Дропдаун

    habr.com/ru/companies/serverma

    #процессоры #микроархитектура #zhaoxin #kunpeng #thead #smic #x86 #arm #loongarch #riscv

  10. Как китайцы убили x86, ARM и создали своё — детектив Восточном экспрессе

    Привет, постоянные и не очень читатели! Пора вернуться к моим любимым архитектурам, процессорам, техпроцессам и всему причастному. Это седьмой и САМЫЙ масштабный материал из цикла (и, вероятно, во всём Рунете) про китайские ISA, микроархитектуры и микроэлектронику. Что было раньше: Part I : Скандальное разоблачение x86: ARM врывается с двух ног (58K, +61, 160 комментариев) Part II : Этой индустрии нужен новый герой: ARM врывается с двух ног Part III : Китайский киднэппинг: похищение дочки Part IV : RISC‑V — звезда родилась: x86 не у дел, ARM сломала две ноги (67K, +64, 207 комментариев) Part V : Смерть GPU/CPU на транзисторах — архитектура квантовых компьютеров Part VI : У VLIW длиннее x86: Itanium в шаге от величества, Эльбрус — подержите моё пиво, тайны PS2 Part VII: Как китайцы x86 и ARM убили и создали своё — детектив в Восточном экспрессе ← ВЫ ЗДЕСЬ Part VIII — ██████████████. В этом лонгриде я расскажу вам всё о серверных процессорах из Поднебесной на всех ключевых архитектурах: ARM (Huawei), x86 (Zhaoxin), RISC-V (T-Head) и LoongArch (Loongson). Будет и про строящиеся мегафабрики Huawei, и про создание независимой ISA (как наш Эльбрус, но с конкурентными продуктами и производством), и про китайские лицензированные x86-процессоры, и про многое другое. Бонусом в каждом разделе распишу интересные факты про иероглифы в названиях компаний и их продуктах (символизм в китайской культуре). Например, вы узнаете, как компания Медоед куёт свои процессоры из легендарной стали (образно), чтобы бесстрашно сражаться с западными техногигантами (буквально). И это не шутка, а оммаж на мемы про медоедов . Дамы и господа — Восточный экспресс готов к посадке. Пожалуйста, позвольте стюарду проводить вас к личному купе. Дропдаун

    habr.com/ru/companies/serverma

    #процессоры #микроархитектура #zhaoxin #kunpeng #thead #smic #x86 #arm #loongarch #riscv

  11. Как китайцы убили x86, ARM и создали своё — детектив Восточном экспрессе

    Привет, постоянные и не очень читатели! Пора вернуться к моим любимым архитектурам, процессорам, техпроцессам и всему причастному. Это седьмой и САМЫЙ масштабный материал из цикла (и, вероятно, во всём Рунете) про китайские ISA, микроархитектуры и микроэлектронику. Что было раньше: Part I : Скандальное разоблачение x86: ARM врывается с двух ног (58K, +61, 160 комментариев) Part II : Этой индустрии нужен новый герой: ARM врывается с двух ног Part III : Китайский киднэппинг: похищение дочки Part IV : RISC‑V — звезда родилась: x86 не у дел, ARM сломала две ноги (67K, +64, 207 комментариев) Part V : Смерть GPU/CPU на транзисторах — архитектура квантовых компьютеров Part VI : У VLIW длиннее x86: Itanium в шаге от величества, Эльбрус — подержите моё пиво, тайны PS2 Part VII: Как китайцы x86 и ARM убили и создали своё — детектив в Восточном экспрессе ← ВЫ ЗДЕСЬ Part VIII — ██████████████. В этом лонгриде я расскажу вам всё о серверных процессорах из Поднебесной на всех ключевых архитектурах: ARM (Huawei), x86 (Zhaoxin), RISC-V (T-Head) и LoongArch (Loongson). Будет и про строящиеся мегафабрики Huawei, и про создание независимой ISA (как наш Эльбрус, но с конкурентными продуктами и производством), и про китайские лицензированные x86-процессоры, и про многое другое. Бонусом в каждом разделе распишу интересные факты про иероглифы в названиях компаний и их продуктах (символизм в китайской культуре). Например, вы узнаете, как компания Медоед куёт свои процессоры из легендарной стали (образно), чтобы бесстрашно сражаться с западными техногигантами (буквально). И это не шутка, а оммаж на мемы про медоедов . Дамы и господа — Восточный экспресс готов к посадке. Пожалуйста, позвольте стюарду проводить вас к личному купе. Дропдаун

    habr.com/ru/companies/serverma

    #процессоры #микроархитектура #zhaoxin #kunpeng #thead #smic #x86 #arm #loongarch #riscv

  12. Как китайцы убили x86, ARM и создали своё — детектив Восточном экспрессе

    Привет, постоянные и не очень читатели! Пора вернуться к моим любимым архитектурам, процессорам, техпроцессам и всему причастному. Это седьмой и САМЫЙ масштабный материал из цикла (и, вероятно, во всём Рунете) про китайские ISA, микроархитектуры и микроэлектронику. Что было раньше: Part I : Скандальное разоблачение x86: ARM врывается с двух ног (58K, +61, 160 комментариев) Part II : Этой индустрии нужен новый герой: ARM врывается с двух ног Part III : Китайский киднэппинг: похищение дочки Part IV : RISC‑V — звезда родилась: x86 не у дел, ARM сломала две ноги (67K, +64, 207 комментариев) Part V : Смерть GPU/CPU на транзисторах — архитектура квантовых компьютеров Part VI : У VLIW длиннее x86: Itanium в шаге от величества, Эльбрус — подержите моё пиво, тайны PS2 Part VII: Как китайцы x86 и ARM убили и создали своё — детектив в Восточном экспрессе ← ВЫ ЗДЕСЬ Part VIII — ██████████████. В этом лонгриде я расскажу вам всё о серверных процессорах из Поднебесной на всех ключевых архитектурах: ARM (Huawei), x86 (Zhaoxin), RISC-V (T-Head) и LoongArch (Loongson). Будет и про строящиеся мегафабрики Huawei, и про создание независимой ISA (как наш Эльбрус, но с конкурентными продуктами и производством), и про китайские лицензированные x86-процессоры, и про многое другое. Бонусом в каждом разделе распишу интересные факты про иероглифы в названиях компаний и их продуктах (символизм в китайской культуре). Например, вы узнаете, как компания Медоед куёт свои процессоры из легендарной стали (образно), чтобы бесстрашно сражаться с западными техногигантами (буквально). И это не шутка, а оммаж на мемы про медоедов . Дамы и господа — Восточный экспресс готов к посадке. Пожалуйста, позвольте стюарду проводить вас к личному купе. Дропдаун

    habr.com/ru/companies/serverma

    #процессоры #микроархитектура #zhaoxin #kunpeng #thead #smic #x86 #arm #loongarch #riscv

  13. [Перевод] Исследование кремниевых кристаллов процессора Intel 386

    386 — редкий случай, когда топология кристалла напрямую пересекается с историей индустрии. В этой статье разберём, как переход x86 на 32 бита и смена NMOS на CMOS отразились на самом чипе: где живут тракт данных и ПЗУ микрокода, почему shrink с 1,5 до 1,0 мкм дал ~60% экономии площади, но потребовал переложить блоки и переосмыслить разводку. Посмотрим, чем DX отличается от SX на уровне бонд-площадок и шин, и почему у 386 SL транзисторов стало втрое больше — из-за интеграции контроллеров, SMM и логики управления питанием. Это взгляд на 80386 через микрофотографии — и на эпоху, в которой Compaq перехватил архитектурное лидерство у IBM. Заглянуть внутрь 386

    habr.com/ru/companies/otus/art

    #процессор_Intel_386 #архитектура_x86 #микроархитектура #кремниевый_кристал #микрокод #эволюция_процессоров #компоновка_микросхем #CHMOSIII

  14. [Перевод] Исследование кремниевых кристаллов процессора Intel 386

    386 — редкий случай, когда топология кристалла напрямую пересекается с историей индустрии. В этой статье разберём, как переход x86 на 32 бита и смена NMOS на CMOS отразились на самом чипе: где живут тракт данных и ПЗУ микрокода, почему shrink с 1,5 до 1,0 мкм дал ~60% экономии площади, но потребовал переложить блоки и переосмыслить разводку. Посмотрим, чем DX отличается от SX на уровне бонд-площадок и шин, и почему у 386 SL транзисторов стало втрое больше — из-за интеграции контроллеров, SMM и логики управления питанием. Это взгляд на 80386 через микрофотографии — и на эпоху, в которой Compaq перехватил архитектурное лидерство у IBM. Заглянуть внутрь 386

    habr.com/ru/companies/otus/art

    #процессор_Intel_386 #архитектура_x86 #микроархитектура #кремниевый_кристал #микрокод #эволюция_процессоров #компоновка_микросхем #CHMOSIII

  15. [Перевод] Исследование кремниевых кристаллов процессора Intel 386

    386 — редкий случай, когда топология кристалла напрямую пересекается с историей индустрии. В этой статье разберём, как переход x86 на 32 бита и смена NMOS на CMOS отразились на самом чипе: где живут тракт данных и ПЗУ микрокода, почему shrink с 1,5 до 1,0 мкм дал ~60% экономии площади, но потребовал переложить блоки и переосмыслить разводку. Посмотрим, чем DX отличается от SX на уровне бонд-площадок и шин, и почему у 386 SL транзисторов стало втрое больше — из-за интеграции контроллеров, SMM и логики управления питанием. Это взгляд на 80386 через микрофотографии — и на эпоху, в которой Compaq перехватил архитектурное лидерство у IBM. Заглянуть внутрь 386

    habr.com/ru/companies/otus/art

    #процессор_Intel_386 #архитектура_x86 #микроархитектура #кремниевый_кристал #микрокод #эволюция_процессоров #компоновка_микросхем #CHMOSIII

  16. [Перевод] Исследование кремниевых кристаллов процессора Intel 386

    386 — редкий случай, когда топология кристалла напрямую пересекается с историей индустрии. В этой статье разберём, как переход x86 на 32 бита и смена NMOS на CMOS отразились на самом чипе: где живут тракт данных и ПЗУ микрокода, почему shrink с 1,5 до 1,0 мкм дал ~60% экономии площади, но потребовал переложить блоки и переосмыслить разводку. Посмотрим, чем DX отличается от SX на уровне бонд-площадок и шин, и почему у 386 SL транзисторов стало втрое больше — из-за интеграции контроллеров, SMM и логики управления питанием. Это взгляд на 80386 через микрофотографии — и на эпоху, в которой Compaq перехватил архитектурное лидерство у IBM. Заглянуть внутрь 386

    habr.com/ru/companies/otus/art

    #процессор_Intel_386 #архитектура_x86 #микроархитектура #кремниевый_кристал #микрокод #эволюция_процессоров #компоновка_микросхем #CHMOSIII

  17. [Перевод] Загадка потерянного инкремента

    Всё вроде должно быть просто Сцена этого конкретного преступления может показаться неправдоподобной: аномалия производительности, возникающая в простейшем машинном коде. На самом деле, его даже можно назвать чрезмерно упрощённым, ведь он не выполняет никакой полезной работы. Он нужен лишь для того, чтобы продемонстрировать поведение оборудования в образовательных целях. Но по моему опыту, чрезвычайно простой машинный код — это, на самом деле, один из самых частых источников чего-то странного. Так как мы передаём CPU ограниченное количество крайне специфичных команд без остальной части когда, то упираемся в границы того, что проектировщики оборудования ожидали встретить в реальном мире. В этой ситуации вы с большей вероятностью сможете пощупать границы микроархитектуры, чем в более стандартном сценарии.

    habr.com/ru/articles/864764/

    #микроархитектура #alder_lake #микрооптимизация #оптимизация_кода

  18. [Перевод] Загадка потерянного инкремента

    Всё вроде должно быть просто Сцена этого конкретного преступления может показаться неправдоподобной: аномалия производительности, возникающая в простейшем машинном коде. На самом деле, его даже можно назвать чрезмерно упрощённым, ведь он не выполняет никакой полезной работы. Он нужен лишь для того, чтобы продемонстрировать поведение оборудования в образовательных целях. Но по моему опыту, чрезвычайно простой машинный код — это, на самом деле, один из самых частых источников чего-то странного. Так как мы передаём CPU ограниченное количество крайне специфичных команд без остальной части когда, то упираемся в границы того, что проектировщики оборудования ожидали встретить в реальном мире. В этой ситуации вы с большей вероятностью сможете пощупать границы микроархитектуры, чем в более стандартном сценарии.

    habr.com/ru/articles/864764/

    #микроархитектура #alder_lake #микрооптимизация #оптимизация_кода

  19. [Перевод] Загадка потерянного инкремента

    Всё вроде должно быть просто Сцена этого конкретного преступления может показаться неправдоподобной: аномалия производительности, возникающая в простейшем машинном коде. На самом деле, его даже можно назвать чрезмерно упрощённым, ведь он не выполняет никакой полезной работы. Он нужен лишь для того, чтобы продемонстрировать поведение оборудования в образовательных целях. Но по моему опыту, чрезвычайно простой машинный код — это, на самом деле, один из самых частых источников чего-то странного. Так как мы передаём CPU ограниченное количество крайне специфичных команд без остальной части когда, то упираемся в границы того, что проектировщики оборудования ожидали встретить в реальном мире. В этой ситуации вы с большей вероятностью сможете пощупать границы микроархитектуры, чем в более стандартном сценарии.

    habr.com/ru/articles/864764/

    #микроархитектура #alder_lake #микрооптимизация #оптимизация_кода

  20. [Перевод] Загадка потерянного инкремента

    Всё вроде должно быть просто Сцена этого конкретного преступления может показаться неправдоподобной: аномалия производительности, возникающая в простейшем машинном коде. На самом деле, его даже можно назвать чрезмерно упрощённым, ведь он не выполняет никакой полезной работы. Он нужен лишь для того, чтобы продемонстрировать поведение оборудования в образовательных целях. Но по моему опыту, чрезвычайно простой машинный код — это, на самом деле, один из самых частых источников чего-то странного. Так как мы передаём CPU ограниченное количество крайне специфичных команд без остальной части когда, то упираемся в границы того, что проектировщики оборудования ожидали встретить в реальном мире. В этой ситуации вы с большей вероятностью сможете пощупать границы микроархитектуры, чем в более стандартном сценарии.

    habr.com/ru/articles/864764/

    #микроархитектура #alder_lake #микрооптимизация #оптимизация_кода

  21. Повышение эффективности образования методом «Безумного Макса», в применении для хардвера высокоскоростных вычислений

    Когда студент устраивается на работу в электронную компанию, очень здорово, если он уже умеет строить одну и ту же электронную схему разными способами, в зависимости от требований пропускной способности, максимальной тактовой частоты, размера и энергопотребления. Как натренировать такое умение? Для новых домашних работ в программе Школы Синтеза Цифровых Схем мы решили разодрать на блоки реальный процессор и дать студентам задачу собирать разные специализированные вычислительные устройства из этих блоков, примерно как герои фильма "Безумный Макс: Дорога ярости" собирали свои боевые драндулеты из частей реальных автомобилей. В качестве первой жертвы мы выбрали ...

    habr.com/ru/articles/862734/

    #Verilog #VHDL #микроархитектура #riscv #FPU #ieee754 #SystemVerilog #школа_синтеза_цифровых_схем #openhwgroup #образование