#микроархитектура — Public Fediverse posts
Live and recent posts from across the Fediverse tagged #микроархитектура, aggregated by home.social.
-
Как одна буква в ассемблере стоит 3× производительности
Я хочу показать вам, как одна буква в ассемблере может стоить 3× производительности. Не в теории — на живых замерах. По дороге мы заглянем внутрь процессора: Register Alias Table, partial register merge, scheduler, latency vs throughput, и даже обнаружим, что делитель выдаёт остаток раньше частного. Но начнём с основ. Приготовьтесь: кроличья нора окажется глубже, чем кажется.
https://habr.com/ru/articles/1024862/
#x86 #assembly #NASM #div #partial_register_merge #latency #throughput #микроархитектура #Skylake #оптимизация
-
Как одна буква в ассемблере стоит 3× производительности
Я хочу показать вам, как одна буква в ассемблере может стоить 3× производительности. Не в теории — на живых замерах. По дороге мы заглянем внутрь процессора: Register Alias Table, partial register merge, scheduler, latency vs throughput, и даже обнаружим, что делитель выдаёт остаток раньше частного. Но начнём с основ. Приготовьтесь: кроличья нора окажется глубже, чем кажется.
https://habr.com/ru/articles/1024862/
#x86 #assembly #NASM #div #partial_register_merge #latency #throughput #микроархитектура #Skylake #оптимизация
-
Как одна буква в ассемблере стоит 3× производительности
Я хочу показать вам, как одна буква в ассемблере может стоить 3× производительности. Не в теории — на живых замерах. По дороге мы заглянем внутрь процессора: Register Alias Table, partial register merge, scheduler, latency vs throughput, и даже обнаружим, что делитель выдаёт остаток раньше частного. Но начнём с основ. Приготовьтесь: кроличья нора окажется глубже, чем кажется.
https://habr.com/ru/articles/1024862/
#x86 #assembly #NASM #div #partial_register_merge #latency #throughput #микроархитектура #Skylake #оптимизация
-
Как одна буква в ассемблере стоит 3× производительности
Я хочу показать вам, как одна буква в ассемблере может стоить 3× производительности. Не в теории — на живых замерах. По дороге мы заглянем внутрь процессора: Register Alias Table, partial register merge, scheduler, latency vs throughput, и даже обнаружим, что делитель выдаёт остаток раньше частного. Но начнём с основ. Приготовьтесь: кроличья нора окажется глубже, чем кажется.
https://habr.com/ru/articles/1024862/
#x86 #assembly #NASM #div #partial_register_merge #latency #throughput #микроархитектура #Skylake #оптимизация
-
[Перевод] Реверс-инжиниринг АЛУ процессора 8086 по фотографиям кристалла
Как устроено арифметико-логическое устройство процессора, если смотреть не на блок-схемы из учебников, а на сам кристалл? В этой статье — очередной захватывающий разбор АЛУ Intel 8086 через реверс-инжиниринг от Ken Shirriff: от фотографий кремния до понимания, как реализованы перенос, логические операции и сдвиги на уровне транзисторов. По ходу станет видно, какие инженерные компромиссы стояли за архитектурой и почему даже базовые операции в реальном железе устроены сложнее, чем кажется по спецификации. Вглубь процессора
https://habr.com/ru/companies/otus/articles/1023002/
#реверсинжиниринг #intel_8086 #алу #арифметикологическое_устройство #схемотехника #транзисторы_NMOS #микроархитектура #кремниевый_кристалл #мультиплексор
-
[Перевод] Реверс-инжиниринг АЛУ процессора 8086 по фотографиям кристалла
Как устроено арифметико-логическое устройство процессора, если смотреть не на блок-схемы из учебников, а на сам кристалл? В этой статье — очередной захватывающий разбор АЛУ Intel 8086 через реверс-инжиниринг от Ken Shirriff: от фотографий кремния до понимания, как реализованы перенос, логические операции и сдвиги на уровне транзисторов. По ходу станет видно, какие инженерные компромиссы стояли за архитектурой и почему даже базовые операции в реальном железе устроены сложнее, чем кажется по спецификации. Вглубь процессора
https://habr.com/ru/companies/otus/articles/1023002/
#реверсинжиниринг #intel_8086 #алу #арифметикологическое_устройство #схемотехника #транзисторы_NMOS #микроархитектура #кремниевый_кристалл #мультиплексор
-
[Перевод] Реверс-инжиниринг АЛУ процессора 8086 по фотографиям кристалла
Как устроено арифметико-логическое устройство процессора, если смотреть не на блок-схемы из учебников, а на сам кристалл? В этой статье — очередной захватывающий разбор АЛУ Intel 8086 через реверс-инжиниринг от Ken Shirriff: от фотографий кремния до понимания, как реализованы перенос, логические операции и сдвиги на уровне транзисторов. По ходу станет видно, какие инженерные компромиссы стояли за архитектурой и почему даже базовые операции в реальном железе устроены сложнее, чем кажется по спецификации. Вглубь процессора
https://habr.com/ru/companies/otus/articles/1023002/
#реверсинжиниринг #intel_8086 #алу #арифметикологическое_устройство #схемотехника #транзисторы_NMOS #микроархитектура #кремниевый_кристалл #мультиплексор
-
[Перевод] Реверс-инжиниринг АЛУ процессора 8086 по фотографиям кристалла
Как устроено арифметико-логическое устройство процессора, если смотреть не на блок-схемы из учебников, а на сам кристалл? В этой статье — очередной захватывающий разбор АЛУ Intel 8086 через реверс-инжиниринг от Ken Shirriff: от фотографий кремния до понимания, как реализованы перенос, логические операции и сдвиги на уровне транзисторов. По ходу станет видно, какие инженерные компромиссы стояли за архитектурой и почему даже базовые операции в реальном железе устроены сложнее, чем кажется по спецификации. Вглубь процессора
https://habr.com/ru/companies/otus/articles/1023002/
#реверсинжиниринг #intel_8086 #алу #арифметикологическое_устройство #схемотехника #транзисторы_NMOS #микроархитектура #кремниевый_кристалл #мультиплексор
-
Как китайцы убили x86, ARM и создали своё — детектив Восточном экспрессе
Привет, постоянные и не очень читатели! Пора вернуться к моим любимым архитектурам, процессорам, техпроцессам и всему причастному. Это седьмой и САМЫЙ масштабный материал из цикла (и, вероятно, во всём Рунете) про китайские ISA, микроархитектуры и микроэлектронику. Что было раньше: Part I : Скандальное разоблачение x86: ARM врывается с двух ног (58K, +61, 160 комментариев) Part II : Этой индустрии нужен новый герой: ARM врывается с двух ног Part III : Китайский киднэппинг: похищение дочки Part IV : RISC‑V — звезда родилась: x86 не у дел, ARM сломала две ноги (67K, +64, 207 комментариев) Part V : Смерть GPU/CPU на транзисторах — архитектура квантовых компьютеров Part VI : У VLIW длиннее x86: Itanium в шаге от величества, Эльбрус — подержите моё пиво, тайны PS2 Part VII: Как китайцы x86 и ARM убили и создали своё — детектив в Восточном экспрессе ← ВЫ ЗДЕСЬ Part VIII — ██████████████. В этом лонгриде я расскажу вам всё о серверных процессорах из Поднебесной на всех ключевых архитектурах: ARM (Huawei), x86 (Zhaoxin), RISC-V (T-Head) и LoongArch (Loongson). Будет и про строящиеся мегафабрики Huawei, и про создание независимой ISA (как наш Эльбрус, но с конкурентными продуктами и производством), и про китайские лицензированные x86-процессоры, и про многое другое. Бонусом в каждом разделе распишу интересные факты про иероглифы в названиях компаний и их продуктах (символизм в китайской культуре). Например, вы узнаете, как компания Медоед куёт свои процессоры из легендарной стали (образно), чтобы бесстрашно сражаться с западными техногигантами (буквально). И это не шутка, а оммаж на мемы про медоедов . Дамы и господа — Восточный экспресс готов к посадке. Пожалуйста, позвольте стюарду проводить вас к личному купе. Дропдаун
https://habr.com/ru/companies/servermall/articles/968900/
#процессоры #микроархитектура #zhaoxin #kunpeng #thead #smic #x86 #arm #loongarch #riscv
-
Как китайцы убили x86, ARM и создали своё — детектив Восточном экспрессе
Привет, постоянные и не очень читатели! Пора вернуться к моим любимым архитектурам, процессорам, техпроцессам и всему причастному. Это седьмой и САМЫЙ масштабный материал из цикла (и, вероятно, во всём Рунете) про китайские ISA, микроархитектуры и микроэлектронику. Что было раньше: Part I : Скандальное разоблачение x86: ARM врывается с двух ног (58K, +61, 160 комментариев) Part II : Этой индустрии нужен новый герой: ARM врывается с двух ног Part III : Китайский киднэппинг: похищение дочки Part IV : RISC‑V — звезда родилась: x86 не у дел, ARM сломала две ноги (67K, +64, 207 комментариев) Part V : Смерть GPU/CPU на транзисторах — архитектура квантовых компьютеров Part VI : У VLIW длиннее x86: Itanium в шаге от величества, Эльбрус — подержите моё пиво, тайны PS2 Part VII: Как китайцы x86 и ARM убили и создали своё — детектив в Восточном экспрессе ← ВЫ ЗДЕСЬ Part VIII — ██████████████. В этом лонгриде я расскажу вам всё о серверных процессорах из Поднебесной на всех ключевых архитектурах: ARM (Huawei), x86 (Zhaoxin), RISC-V (T-Head) и LoongArch (Loongson). Будет и про строящиеся мегафабрики Huawei, и про создание независимой ISA (как наш Эльбрус, но с конкурентными продуктами и производством), и про китайские лицензированные x86-процессоры, и про многое другое. Бонусом в каждом разделе распишу интересные факты про иероглифы в названиях компаний и их продуктах (символизм в китайской культуре). Например, вы узнаете, как компания Медоед куёт свои процессоры из легендарной стали (образно), чтобы бесстрашно сражаться с западными техногигантами (буквально). И это не шутка, а оммаж на мемы про медоедов . Дамы и господа — Восточный экспресс готов к посадке. Пожалуйста, позвольте стюарду проводить вас к личному купе. Дропдаун
https://habr.com/ru/companies/servermall/articles/968900/
#процессоры #микроархитектура #zhaoxin #kunpeng #thead #smic #x86 #arm #loongarch #riscv
-
Как китайцы убили x86, ARM и создали своё — детектив Восточном экспрессе
Привет, постоянные и не очень читатели! Пора вернуться к моим любимым архитектурам, процессорам, техпроцессам и всему причастному. Это седьмой и САМЫЙ масштабный материал из цикла (и, вероятно, во всём Рунете) про китайские ISA, микроархитектуры и микроэлектронику. Что было раньше: Part I : Скандальное разоблачение x86: ARM врывается с двух ног (58K, +61, 160 комментариев) Part II : Этой индустрии нужен новый герой: ARM врывается с двух ног Part III : Китайский киднэппинг: похищение дочки Part IV : RISC‑V — звезда родилась: x86 не у дел, ARM сломала две ноги (67K, +64, 207 комментариев) Part V : Смерть GPU/CPU на транзисторах — архитектура квантовых компьютеров Part VI : У VLIW длиннее x86: Itanium в шаге от величества, Эльбрус — подержите моё пиво, тайны PS2 Part VII: Как китайцы x86 и ARM убили и создали своё — детектив в Восточном экспрессе ← ВЫ ЗДЕСЬ Part VIII — ██████████████. В этом лонгриде я расскажу вам всё о серверных процессорах из Поднебесной на всех ключевых архитектурах: ARM (Huawei), x86 (Zhaoxin), RISC-V (T-Head) и LoongArch (Loongson). Будет и про строящиеся мегафабрики Huawei, и про создание независимой ISA (как наш Эльбрус, но с конкурентными продуктами и производством), и про китайские лицензированные x86-процессоры, и про многое другое. Бонусом в каждом разделе распишу интересные факты про иероглифы в названиях компаний и их продуктах (символизм в китайской культуре). Например, вы узнаете, как компания Медоед куёт свои процессоры из легендарной стали (образно), чтобы бесстрашно сражаться с западными техногигантами (буквально). И это не шутка, а оммаж на мемы про медоедов . Дамы и господа — Восточный экспресс готов к посадке. Пожалуйста, позвольте стюарду проводить вас к личному купе. Дропдаун
https://habr.com/ru/companies/servermall/articles/968900/
#процессоры #микроархитектура #zhaoxin #kunpeng #thead #smic #x86 #arm #loongarch #riscv
-
Как китайцы убили x86, ARM и создали своё — детектив Восточном экспрессе
Привет, постоянные и не очень читатели! Пора вернуться к моим любимым архитектурам, процессорам, техпроцессам и всему причастному. Это седьмой и САМЫЙ масштабный материал из цикла (и, вероятно, во всём Рунете) про китайские ISA, микроархитектуры и микроэлектронику. Что было раньше: Part I : Скандальное разоблачение x86: ARM врывается с двух ног (58K, +61, 160 комментариев) Part II : Этой индустрии нужен новый герой: ARM врывается с двух ног Part III : Китайский киднэппинг: похищение дочки Part IV : RISC‑V — звезда родилась: x86 не у дел, ARM сломала две ноги (67K, +64, 207 комментариев) Part V : Смерть GPU/CPU на транзисторах — архитектура квантовых компьютеров Part VI : У VLIW длиннее x86: Itanium в шаге от величества, Эльбрус — подержите моё пиво, тайны PS2 Part VII: Как китайцы x86 и ARM убили и создали своё — детектив в Восточном экспрессе ← ВЫ ЗДЕСЬ Part VIII — ██████████████. В этом лонгриде я расскажу вам всё о серверных процессорах из Поднебесной на всех ключевых архитектурах: ARM (Huawei), x86 (Zhaoxin), RISC-V (T-Head) и LoongArch (Loongson). Будет и про строящиеся мегафабрики Huawei, и про создание независимой ISA (как наш Эльбрус, но с конкурентными продуктами и производством), и про китайские лицензированные x86-процессоры, и про многое другое. Бонусом в каждом разделе распишу интересные факты про иероглифы в названиях компаний и их продуктах (символизм в китайской культуре). Например, вы узнаете, как компания Медоед куёт свои процессоры из легендарной стали (образно), чтобы бесстрашно сражаться с западными техногигантами (буквально). И это не шутка, а оммаж на мемы про медоедов . Дамы и господа — Восточный экспресс готов к посадке. Пожалуйста, позвольте стюарду проводить вас к личному купе. Дропдаун
https://habr.com/ru/companies/servermall/articles/968900/
#процессоры #микроархитектура #zhaoxin #kunpeng #thead #smic #x86 #arm #loongarch #riscv
-
[Перевод] Исследование кремниевых кристаллов процессора Intel 386
386 — редкий случай, когда топология кристалла напрямую пересекается с историей индустрии. В этой статье разберём, как переход x86 на 32 бита и смена NMOS на CMOS отразились на самом чипе: где живут тракт данных и ПЗУ микрокода, почему shrink с 1,5 до 1,0 мкм дал ~60% экономии площади, но потребовал переложить блоки и переосмыслить разводку. Посмотрим, чем DX отличается от SX на уровне бонд-площадок и шин, и почему у 386 SL транзисторов стало втрое больше — из-за интеграции контроллеров, SMM и логики управления питанием. Это взгляд на 80386 через микрофотографии — и на эпоху, в которой Compaq перехватил архитектурное лидерство у IBM. Заглянуть внутрь 386
https://habr.com/ru/companies/otus/articles/954546/
#процессор_Intel_386 #архитектура_x86 #микроархитектура #кремниевый_кристал #микрокод #эволюция_процессоров #компоновка_микросхем #CHMOSIII
-
[Перевод] Исследование кремниевых кристаллов процессора Intel 386
386 — редкий случай, когда топология кристалла напрямую пересекается с историей индустрии. В этой статье разберём, как переход x86 на 32 бита и смена NMOS на CMOS отразились на самом чипе: где живут тракт данных и ПЗУ микрокода, почему shrink с 1,5 до 1,0 мкм дал ~60% экономии площади, но потребовал переложить блоки и переосмыслить разводку. Посмотрим, чем DX отличается от SX на уровне бонд-площадок и шин, и почему у 386 SL транзисторов стало втрое больше — из-за интеграции контроллеров, SMM и логики управления питанием. Это взгляд на 80386 через микрофотографии — и на эпоху, в которой Compaq перехватил архитектурное лидерство у IBM. Заглянуть внутрь 386
https://habr.com/ru/companies/otus/articles/954546/
#процессор_Intel_386 #архитектура_x86 #микроархитектура #кремниевый_кристал #микрокод #эволюция_процессоров #компоновка_микросхем #CHMOSIII
-
[Перевод] Исследование кремниевых кристаллов процессора Intel 386
386 — редкий случай, когда топология кристалла напрямую пересекается с историей индустрии. В этой статье разберём, как переход x86 на 32 бита и смена NMOS на CMOS отразились на самом чипе: где живут тракт данных и ПЗУ микрокода, почему shrink с 1,5 до 1,0 мкм дал ~60% экономии площади, но потребовал переложить блоки и переосмыслить разводку. Посмотрим, чем DX отличается от SX на уровне бонд-площадок и шин, и почему у 386 SL транзисторов стало втрое больше — из-за интеграции контроллеров, SMM и логики управления питанием. Это взгляд на 80386 через микрофотографии — и на эпоху, в которой Compaq перехватил архитектурное лидерство у IBM. Заглянуть внутрь 386
https://habr.com/ru/companies/otus/articles/954546/
#процессор_Intel_386 #архитектура_x86 #микроархитектура #кремниевый_кристал #микрокод #эволюция_процессоров #компоновка_микросхем #CHMOSIII
-
[Перевод] Исследование кремниевых кристаллов процессора Intel 386
386 — редкий случай, когда топология кристалла напрямую пересекается с историей индустрии. В этой статье разберём, как переход x86 на 32 бита и смена NMOS на CMOS отразились на самом чипе: где живут тракт данных и ПЗУ микрокода, почему shrink с 1,5 до 1,0 мкм дал ~60% экономии площади, но потребовал переложить блоки и переосмыслить разводку. Посмотрим, чем DX отличается от SX на уровне бонд-площадок и шин, и почему у 386 SL транзисторов стало втрое больше — из-за интеграции контроллеров, SMM и логики управления питанием. Это взгляд на 80386 через микрофотографии — и на эпоху, в которой Compaq перехватил архитектурное лидерство у IBM. Заглянуть внутрь 386
https://habr.com/ru/companies/otus/articles/954546/
#процессор_Intel_386 #архитектура_x86 #микроархитектура #кремниевый_кристал #микрокод #эволюция_процессоров #компоновка_микросхем #CHMOSIII
-
[Перевод] Загадка потерянного инкремента
Всё вроде должно быть просто Сцена этого конкретного преступления может показаться неправдоподобной: аномалия производительности, возникающая в простейшем машинном коде. На самом деле, его даже можно назвать чрезмерно упрощённым, ведь он не выполняет никакой полезной работы. Он нужен лишь для того, чтобы продемонстрировать поведение оборудования в образовательных целях. Но по моему опыту, чрезвычайно простой машинный код — это, на самом деле, один из самых частых источников чего-то странного. Так как мы передаём CPU ограниченное количество крайне специфичных команд без остальной части когда, то упираемся в границы того, что проектировщики оборудования ожидали встретить в реальном мире. В этой ситуации вы с большей вероятностью сможете пощупать границы микроархитектуры, чем в более стандартном сценарии.
https://habr.com/ru/articles/864764/
#микроархитектура #alder_lake #микрооптимизация #оптимизация_кода
-
[Перевод] Загадка потерянного инкремента
Всё вроде должно быть просто Сцена этого конкретного преступления может показаться неправдоподобной: аномалия производительности, возникающая в простейшем машинном коде. На самом деле, его даже можно назвать чрезмерно упрощённым, ведь он не выполняет никакой полезной работы. Он нужен лишь для того, чтобы продемонстрировать поведение оборудования в образовательных целях. Но по моему опыту, чрезвычайно простой машинный код — это, на самом деле, один из самых частых источников чего-то странного. Так как мы передаём CPU ограниченное количество крайне специфичных команд без остальной части когда, то упираемся в границы того, что проектировщики оборудования ожидали встретить в реальном мире. В этой ситуации вы с большей вероятностью сможете пощупать границы микроархитектуры, чем в более стандартном сценарии.
https://habr.com/ru/articles/864764/
#микроархитектура #alder_lake #микрооптимизация #оптимизация_кода
-
[Перевод] Загадка потерянного инкремента
Всё вроде должно быть просто Сцена этого конкретного преступления может показаться неправдоподобной: аномалия производительности, возникающая в простейшем машинном коде. На самом деле, его даже можно назвать чрезмерно упрощённым, ведь он не выполняет никакой полезной работы. Он нужен лишь для того, чтобы продемонстрировать поведение оборудования в образовательных целях. Но по моему опыту, чрезвычайно простой машинный код — это, на самом деле, один из самых частых источников чего-то странного. Так как мы передаём CPU ограниченное количество крайне специфичных команд без остальной части когда, то упираемся в границы того, что проектировщики оборудования ожидали встретить в реальном мире. В этой ситуации вы с большей вероятностью сможете пощупать границы микроархитектуры, чем в более стандартном сценарии.
https://habr.com/ru/articles/864764/
#микроархитектура #alder_lake #микрооптимизация #оптимизация_кода
-
[Перевод] Загадка потерянного инкремента
Всё вроде должно быть просто Сцена этого конкретного преступления может показаться неправдоподобной: аномалия производительности, возникающая в простейшем машинном коде. На самом деле, его даже можно назвать чрезмерно упрощённым, ведь он не выполняет никакой полезной работы. Он нужен лишь для того, чтобы продемонстрировать поведение оборудования в образовательных целях. Но по моему опыту, чрезвычайно простой машинный код — это, на самом деле, один из самых частых источников чего-то странного. Так как мы передаём CPU ограниченное количество крайне специфичных команд без остальной части когда, то упираемся в границы того, что проектировщики оборудования ожидали встретить в реальном мире. В этой ситуации вы с большей вероятностью сможете пощупать границы микроархитектуры, чем в более стандартном сценарии.
https://habr.com/ru/articles/864764/
#микроархитектура #alder_lake #микрооптимизация #оптимизация_кода
-
Повышение эффективности образования методом «Безумного Макса», в применении для хардвера высокоскоростных вычислений
Когда студент устраивается на работу в электронную компанию, очень здорово, если он уже умеет строить одну и ту же электронную схему разными способами, в зависимости от требований пропускной способности, максимальной тактовой частоты, размера и энергопотребления. Как натренировать такое умение? Для новых домашних работ в программе Школы Синтеза Цифровых Схем мы решили разодрать на блоки реальный процессор и дать студентам задачу собирать разные специализированные вычислительные устройства из этих блоков, примерно как герои фильма "Безумный Макс: Дорога ярости" собирали свои боевые драндулеты из частей реальных автомобилей. В качестве первой жертвы мы выбрали ...
https://habr.com/ru/articles/862734/
#Verilog #VHDL #микроархитектура #riscv #FPU #ieee754 #SystemVerilog #школа_синтеза_цифровых_схем #openhwgroup #образование