#высокопроизводительные_вычисления

Habr @[email protected] · 2026-03-20 · 06:32 UTC

Умножение матриц: пример использования расширения ARM SME2 в Apple M4 Pro

В конце 2020 года я купил MacBook Pro 13 на процессоре Apple M1, очень хотелось испытать процессоры на архитектуре ARM. Почти сразу на чипе Apple M1 был найден вычислительный блок для матричных операций Apple AMX. Для Apple AMX не было документации, он не использовался в Apple Accelerate , но несколько энтузиастов занимались реверс-инжинирингом и анализом производительности ( " https://github.com/corsix/amx " ). В 2024 году вышли компьютеры на базе семейства процессоров Apple M4, у которых блок AMX задействован для выполнения инструкций из Scalable Matrix Extension 2 (сайт ARM недоступен в РФ) (ARM SME2). В статье рассмотрим использование расширения ARM SME2 на примере умножения заполненных матриц. Увидим, как выжать максимум из процессора и получить прирост производительности в десятки раз.

https://habr.com/ru/articles/1012528/

#ARM_SME #Apple_M #gemm #умножение_матриц #линейная_алгебра #вычислительные_методы #высокопроизводительные_вычисления #оптимизация_кода #векторные_инструкции #векторные_исчисления

#векторные_исчисления #векторные_инструкции #оптимизация_кода #высокопроизводительные_вычисления #вычислительные_методы #линейная_алгебра

Habr @[email protected] · 2026-03-20 · 06:32 UTC

Умножение матриц: пример использования расширения ARM SME2 в Apple M4 Pro

В конце 2020 года я купил MacBook Pro 13 на процессоре Apple M1, очень хотелось испытать процессоры на архитектуре ARM. Почти сразу на чипе Apple M1 был найден вычислительный блок для матричных операций Apple AMX. Для Apple AMX не было документации, он не использовался в Apple Accelerate , но несколько энтузиастов занимались реверс-инжинирингом и анализом производительности ( " https://github.com/corsix/amx " ). В 2024 году вышли компьютеры на базе семейства процессоров Apple M4, у которых блок AMX задействован для выполнения инструкций из Scalable Matrix Extension 2 (сайт ARM недоступен в РФ) (ARM SME2). В статье рассмотрим использование расширения ARM SME2 на примере умножения заполненных матриц. Увидим, как выжать максимум из процессора и получить прирост производительности в десятки раз.

https://habr.com/ru/articles/1012528/

#ARM_SME #Apple_M #gemm #умножение_матриц #линейная_алгебра #вычислительные_методы #высокопроизводительные_вычисления #оптимизация_кода #векторные_инструкции #векторные_исчисления

#векторные_исчисления #векторные_инструкции #оптимизация_кода #высокопроизводительные_вычисления #вычислительные_методы #линейная_алгебра

Habr @[email protected] · 2026-03-20 · 06:32 UTC

Умножение матриц: пример использования расширения ARM SME2 в Apple M4 Pro

В конце 2020 года я купил MacBook Pro 13 на процессоре Apple M1, очень хотелось испытать процессоры на архитектуре ARM. Почти сразу на чипе Apple M1 был найден вычислительный блок для матричных операций Apple AMX. Для Apple AMX не было документации, он не использовался в Apple Accelerate , но несколько энтузиастов занимались реверс-инжинирингом и анализом производительности ( " https://github.com/corsix/amx " ). В 2024 году вышли компьютеры на базе семейства процессоров Apple M4, у которых блок AMX задействован для выполнения инструкций из Scalable Matrix Extension 2 (сайт ARM недоступен в РФ) (ARM SME2). В статье рассмотрим использование расширения ARM SME2 на примере умножения заполненных матриц. Увидим, как выжать максимум из процессора и получить прирост производительности в десятки раз.

https://habr.com/ru/articles/1012528/

#ARM_SME #Apple_M #gemm #умножение_матриц #линейная_алгебра #вычислительные_методы #высокопроизводительные_вычисления #оптимизация_кода #векторные_инструкции #векторные_исчисления

#векторные_исчисления #векторные_инструкции #оптимизация_кода #высокопроизводительные_вычисления #вычислительные_методы #линейная_алгебра

Habr @[email protected] · 2026-03-20 · 06:32 UTC

Умножение матриц: пример использования расширения ARM SME2 в Apple M4 Pro

В конце 2020 года я купил MacBook Pro 13 на процессоре Apple M1, очень хотелось испытать процессоры на архитектуре ARM. Почти сразу на чипе Apple M1 был найден вычислительный блок для матричных операций Apple AMX. Для Apple AMX не было документации, он не использовался в Apple Accelerate , но несколько энтузиастов занимались реверс-инжинирингом и анализом производительности ( " https://github.com/corsix/amx " ). В 2024 году вышли компьютеры на базе семейства процессоров Apple M4, у которых блок AMX задействован для выполнения инструкций из Scalable Matrix Extension 2 (сайт ARM недоступен в РФ) (ARM SME2). В статье рассмотрим использование расширения ARM SME2 на примере умножения заполненных матриц. Увидим, как выжать максимум из процессора и получить прирост производительности в десятки раз.

https://habr.com/ru/articles/1012528/

#ARM_SME #Apple_M #gemm #умножение_матриц #линейная_алгебра #вычислительные_методы #высокопроизводительные_вычисления #оптимизация_кода #векторные_инструкции #векторные_исчисления

#arm_sme #apple_m #gemm #умножение_матриц #линейная_алгебра #вычислительные_методы

Habr @[email protected] · 2026-03-16 · 18:02 UTC

Введение в высокопроизводительные вычисления на С++ для CPU

" Поскольку вы программист на C++, вероятность того, что вы слегка одержимы производительностью, выше среднего. А если нет, то вы, вероятно, по крайней мере с пониманием относитесь к такой точке зрения. (Если производительность вас совсем не интересует, аудитория Python разработчиков дальше по коридору) " — Из пункта 42 книги С. Майерса “Effective Modern C++”, 2015. Эта заметка описывает мой личный взгляд на то, как писать эффективный и надежный код для CPU. Статья ориентируется на С++, но значительная часть обсуждения CPU, кэшей, паттернов доступа к памяти и профилирования применима к Rust, Go и другим компилируемым языкам. Статья задумана как краткое введение и больше всего подходит студентам, имеющим опыт программирования на занятиях, но не в реальных проектах. Для профессионалов статья может быть полезной в качестве референса, чтобы не пугать новичков чем-то в духе Что каждый программист должен знать о памяти . В статье опишу "набор новичка": godbolt.org, профилирование, бенчмарки, особенности CPU и его взаимодействия с памятью, когда есть ли смысл от асимптотических оптимизаций и почему важно при этом пользоваться санитайзерами, отслеживать coverage и вообще более трепетно относится к надёжности.

https://habr.com/ru/articles/1011014/

#высокопроизводительные_вычисления #cpu #ram #cache #simd #оптимизация #профилирование

#профилирование #оптимизация #simd #cache #ram #cpu

Habr @[email protected] · 2026-03-16 · 18:02 UTC

Введение в высокопроизводительные вычисления на С++ для CPU

" Поскольку вы программист на C++, вероятность того, что вы слегка одержимы производительностью, выше среднего. А если нет, то вы, вероятно, по крайней мере с пониманием относитесь к такой точке зрения. (Если производительность вас совсем не интересует, аудитория Python разработчиков дальше по коридору) " — Из пункта 42 книги С. Майерса “Effective Modern C++”, 2015. Эта заметка описывает мой личный взгляд на то, как писать эффективный и надежный код для CPU. Статья ориентируется на С++, но значительная часть обсуждения CPU, кэшей, паттернов доступа к памяти и профилирования применима к Rust, Go и другим компилируемым языкам. Статья задумана как краткое введение и больше всего подходит студентам, имеющим опыт программирования на занятиях, но не в реальных проектах. Для профессионалов статья может быть полезной в качестве референса, чтобы не пугать новичков чем-то в духе Что каждый программист должен знать о памяти . В статье опишу "набор новичка": godbolt.org, профилирование, бенчмарки, особенности CPU и его взаимодействия с памятью, когда есть ли смысл от асимптотических оптимизаций и почему важно при этом пользоваться санитайзерами, отслеживать coverage и вообще более трепетно относится к надёжности.

https://habr.com/ru/articles/1011014/

#высокопроизводительные_вычисления #cpu #ram #cache #simd #оптимизация #профилирование

#профилирование #оптимизация #simd #cache #ram #cpu

Habr @[email protected] · 2026-03-16 · 18:02 UTC

Введение в высокопроизводительные вычисления на С++ для CPU

" Поскольку вы программист на C++, вероятность того, что вы слегка одержимы производительностью, выше среднего. А если нет, то вы, вероятно, по крайней мере с пониманием относитесь к такой точке зрения. (Если производительность вас совсем не интересует, аудитория Python разработчиков дальше по коридору) " — Из пункта 42 книги С. Майерса “Effective Modern C++”, 2015. Эта заметка описывает мой личный взгляд на то, как писать эффективный и надежный код для CPU. Статья ориентируется на С++, но значительная часть обсуждения CPU, кэшей, паттернов доступа к памяти и профилирования применима к Rust, Go и другим компилируемым языкам. Статья задумана как краткое введение и больше всего подходит студентам, имеющим опыт программирования на занятиях, но не в реальных проектах. Для профессионалов статья может быть полезной в качестве референса, чтобы не пугать новичков чем-то в духе Что каждый программист должен знать о памяти . В статье опишу "набор новичка": godbolt.org, профилирование, бенчмарки, особенности CPU и его взаимодействия с памятью, когда есть ли смысл от асимптотических оптимизаций и почему важно при этом пользоваться санитайзерами, отслеживать coverage и вообще более трепетно относится к надёжности.

https://habr.com/ru/articles/1011014/

#высокопроизводительные_вычисления #cpu #ram #cache #simd #оптимизация #профилирование

#профилирование #оптимизация #simd #cache #ram #cpu

Habr @[email protected] · 2026-03-16 · 18:02 UTC

Введение в высокопроизводительные вычисления на С++ для CPU

" Поскольку вы программист на C++, вероятность того, что вы слегка одержимы производительностью, выше среднего. А если нет, то вы, вероятно, по крайней мере с пониманием относитесь к такой точке зрения. (Если производительность вас совсем не интересует, аудитория Python разработчиков дальше по коридору) " — Из пункта 42 книги С. Майерса “Effective Modern C++”, 2015. Эта заметка описывает мой личный взгляд на то, как писать эффективный и надежный код для CPU. Статья ориентируется на С++, но значительная часть обсуждения CPU, кэшей, паттернов доступа к памяти и профилирования применима к Rust, Go и другим компилируемым языкам. Статья задумана как краткое введение и больше всего подходит студентам, имеющим опыт программирования на занятиях, но не в реальных проектах. Для профессионалов статья может быть полезной в качестве референса, чтобы не пугать новичков чем-то в духе Что каждый программист должен знать о памяти . В статье опишу "набор новичка": godbolt.org, профилирование, бенчмарки, особенности CPU и его взаимодействия с памятью, когда есть ли смысл от асимптотических оптимизаций и почему важно при этом пользоваться санитайзерами, отслеживать coverage и вообще более трепетно относится к надёжности.

https://habr.com/ru/articles/1011014/

#высокопроизводительные_вычисления #cpu #ram #cache #simd #оптимизация #профилирование

#высокопроизводительные_вычисления #cpu #ram #cache #simd #оптимизация

Habr @[email protected] · 2026-03-09 · 06:32 UTC

Одна Rust-библиотека вместо шести Python-пакетов — или как я перестала запускать фит и идти за кофе

Кому будет полезно Если вы живёте в Python и одновременно используете statsmodels , lifelines , pyhf , PyMC/BlackJAX , linearmodels (или что‑то похожее). Если вам важны воспроизводимость и понятная валидация численных оптимизаций (особенно в HEP). Если вам интересна архитектура «одно вычислительное ядро → много задач» и практические hot paths (AOT, SIMD, zero‑copy).

https://habr.com/ru/articles/1008048/

#статистический_вывод #байесовская_статистика #высокопроизводительные_вычисления #статистическое_моделирование #физика_высоких_энергий #анализ_данных #likelihoodмодели #cuda #python #rust

#rust #python #cuda #likelihoodмодели #анализ_данных #физика_высоких_энергий

Habr @[email protected] · 2025-11-21 · 10:32 UTC

Тест Гилева: почему главный benchmark 1С врет в облаке

В мире 1С нет более известной фамилии, чем Гилев. Его тест — это своего рода «народный» стандарт, первое, что запускают администраторы для проверки производительности. Это простой и быстрый способ получить заветную цифру, которая говорит о скорости системы. Мы и сами решили использовать этот тест, запуская новый высокопроизводительный сервис 1С. Нам нужно было понять, как себя проявят наши новые серверы с процессорами 4.0 ГГц. Но вот в чём загвоздка: тест Гилева — это важный, но далеко не единственный и не всегда адекватный инструмент. Он как спидометр в машине: показывает скорость, но не говорит ничего о том, как авто поведет себя на повороте, при обгоне или с полным багажником. Мы на практике убедились, что его результаты в отрыве от настоящих задач могут несколько отличаться от реальности, особенно в современной облачной среде. Давайте разберемся, почему красивая цифра из теста — это еще не гарантия того, что 1С будет работать быстрее.

https://habr.com/ru/companies/nubes/articles/968814/

#1c #облачные_сервисы #облачные_технологии #тест_гилева #высокопроизводительные_вычисления

Habr @[email protected] · 2025-11-21 · 10:32 UTC

Тест Гилева: почему главный benchmark 1С врет в облаке

В мире 1С нет более известной фамилии, чем Гилев. Его тест — это своего рода «народный» стандарт, первое, что запускают администраторы для проверки производительности. Это простой и быстрый способ получить заветную цифру, которая говорит о скорости системы. Мы и сами решили использовать этот тест, запуская новый высокопроизводительный сервис 1С. Нам нужно было понять, как себя проявят наши новые серверы с процессорами 4.0 ГГц. Но вот в чём загвоздка: тест Гилева — это важный, но далеко не единственный и не всегда адекватный инструмент. Он как спидометр в машине: показывает скорость, но не говорит ничего о том, как авто поведет себя на повороте, при обгоне или с полным багажником. Мы на практике убедились, что его результаты в отрыве от настоящих задач могут несколько отличаться от реальности, особенно в современной облачной среде. Давайте разберемся, почему красивая цифра из теста — это еще не гарантия того, что 1С будет работать быстрее.

https://habr.com/ru/companies/nubes/articles/968814/

#1c #облачные_сервисы #облачные_технологии #тест_гилева #высокопроизводительные_вычисления

Habr @[email protected] · 2025-11-21 · 10:32 UTC

Тест Гилева: почему главный benchmark 1С врет в облаке

В мире 1С нет более известной фамилии, чем Гилев. Его тест — это своего рода «народный» стандарт, первое, что запускают администраторы для проверки производительности. Это простой и быстрый способ получить заветную цифру, которая говорит о скорости системы. Мы и сами решили использовать этот тест, запуская новый высокопроизводительный сервис 1С. Нам нужно было понять, как себя проявят наши новые серверы с процессорами 4.0 ГГц. Но вот в чём загвоздка: тест Гилева — это важный, но далеко не единственный и не всегда адекватный инструмент. Он как спидометр в машине: показывает скорость, но не говорит ничего о том, как авто поведет себя на повороте, при обгоне или с полным багажником. Мы на практике убедились, что его результаты в отрыве от настоящих задач могут несколько отличаться от реальности, особенно в современной облачной среде. Давайте разберемся, почему красивая цифра из теста — это еще не гарантия того, что 1С будет работать быстрее.

https://habr.com/ru/companies/nubes/articles/968814/

#1c #облачные_сервисы #облачные_технологии #тест_гилева #высокопроизводительные_вычисления

Habr @[email protected] · 2025-11-21 · 10:32 UTC

Тест Гилева: почему главный benchmark 1С врет в облаке

В мире 1С нет более известной фамилии, чем Гилев. Его тест — это своего рода «народный» стандарт, первое, что запускают администраторы для проверки производительности. Это простой и быстрый способ получить заветную цифру, которая говорит о скорости системы. Мы и сами решили использовать этот тест, запуская новый высокопроизводительный сервис 1С. Нам нужно было понять, как себя проявят наши новые серверы с процессорами 4.0 ГГц. Но вот в чём загвоздка: тест Гилева — это важный, но далеко не единственный и не всегда адекватный инструмент. Он как спидометр в машине: показывает скорость, но не говорит ничего о том, как авто поведет себя на повороте, при обгоне или с полным багажником. Мы на практике убедились, что его результаты в отрыве от настоящих задач могут несколько отличаться от реальности, особенно в современной облачной среде. Давайте разберемся, почему красивая цифра из теста — это еще не гарантия того, что 1С будет работать быстрее.

https://habr.com/ru/companies/nubes/articles/968814/

#1c #облачные_сервисы #облачные_технологии #тест_гилева #высокопроизводительные_вычисления

#высокопроизводительные_вычисления #тест_гилева #облачные_технологии #облачные_сервисы #1c

Habr @[email protected] · 2025-08-21 · 17:42 UTC

AMD RDNA 4 против NVIDIA: новый виток конкуренции

В мире высоких технологий редко случаются схватки, которые могут изменить целую отрасль. Одна из таких баталий разворачивается прямо сейчас между двумя гигантами — NVIDIA и AMD. На кону стоит контроль над рынком графических процессоров для искусственного интеллекта, который в 2025 году оценивается в десятки миллиардов долларов. Долгое время NVIDIA казалась непобедимой в этой сфере, контролируя до 90% рынка ускорителей для ИИ. Но в последние годы AMD усиливает натиск, предлагая альтернативу, которая серьезно заинтересовала крупных игроков облачного рынка. Разберемся, что происходит в этой технологической войне и почему исход битвы важен для всех нас.

https://habr.com/ru/companies/itglobalcom/articles/939464/

#amd #nvidia #видеокарты #высокопроизводительные_вычисления #blackwell #hopper #instinct #ai #железо_и_технологии

#железо_и_технологии #ai #instinct #hopper #blackwell #высокопроизводительные_вычисления

Habr @[email protected] · 2025-06-25 · 13:52 UTC

HPE построит самый мощный суперкомпьютер в Южной Корее

Южная Корея запускает KISTI-6 — самый мощный суперкомпьютер в стране. В качестве подрядчика Корейский институт научной и технической информации (KISTI) выбрал Hewlett Packard Enterprise (HPE). Компания возьмет на себя строительство шестого по счёту кластера KISTI, получившего название KISTI-6. Он станет самым мощным суперкомпьютером в Южной Корее с передовой системой безвентиляторного прямого жидкостного охлаждения. Применение данной технологии обеспечит плотность размещения, эффективность и устойчивость системы на новом уровне.

https://habr.com/ru/companies/itglobalcom/articles/921752/

#hpe #суперкомпьютер #ai #генеративный_ии #масштабируемость #высокопроизводительные_вычисления

Habr @[email protected] · 2025-05-28 · 10:12 UTC

Как консолидировать данные из разрозненных хранилищ с помощью Tarantool CDC

Компании часто сталкиваются с необходимостью переливать данные между системами. Но нередко это превращается в настоящий квест: форматы данных могут различаться, для интеграции инструментов может не быть готовых коннекторов, самостоятельно гарантировать консистентность данных в целевой системе может быть сложно или невозможно. Поэтому подобные задачи редко обходятся без применения CDC (Change Data Capture). Меня зовут Андрей Капустин. Я менеджер продукта Tarantool CDC в компании VK Tech. В этой статье я расскажу о Tarantool CDC и о том, как инструмент помогает консолидировать данные из разрозненных хранилищ, в том числе проприетарных СУБД, обеспечивая прозрачность, высокую консистентность и скорость. Как разрабатывался Tarantool CDC

https://habr.com/ru/companies/vktech/articles/913352/

#Tarantool #архитектура #отказоустойчивость #postgresql #высокопроизводительные_вычисления #распределенные_системы #субд #Tarantool_Queue_Enterprise #Tarantool_CDC #change_data_capture

#change_data_capture #tarantool_cdc #tarantool_queue_enterprise #субд #распределенные_системы #высокопроизводительные_вычисления

Habr @[email protected] · 2024-11-06 · 17:12 UTC

Национальный Суперкомпьютерный Форум пройдёт в Переславле 26—29 ноября 2024 года

Тринадцатый НСКФ пройдёт с 26 по 29 ноября 2024 года. В его программе будут научно-практическая конференция, мастер-классы, выставка, пресс-конференция и круглый стол. В холле будут чай, кофе, печенье и неформальное общение. Добро пожаловать!

https://habr.com/ru/articles/856596/

#НСКФ #ИПС_РАН #конференция #суперкомпьютер #гриды #высокопроизводительные_вычисления

#нскф #ипс_ран #конференция #суперкомпьютер #гриды #высокопроизводительные_вычисления

Habr @[email protected] · 2024-01-18 · 15:32 UTC

Зимняя школа по RISC-V — актуальные знания по перспективной открытой архитектуре от экспертов

С 2 по 8 февраля пройдет Узнать больше →

https://habr.com/ru/companies/yadro/articles/787152/

#riscv #открытая_архитектура #студенты #интенсив #оптимизация #высокопроизводительные_вычисления #лекции

#лекции #высокопроизводительные_вычисления #оптимизация #интенсив #студенты #открытая_архитектура

Habr @[email protected] · 2024-07-16 · 12:52 UTC

Заглянем в хрустальный шар: как продвигается разработка стандартных матричных расширений RISC-V

Привет, Хабр! В предыдущем тексте мы рассмотрели все существующие матричные расширения. Возникает вопрос: ждать ли в ближайшее время новых расширений для матричных операций? Ответ — да, они разрабатываются прямо сейчас для архитектуры RISC-V. Новость может вызвать удивление, ведь в обзоре уже есть целых два матричных расширения RISC-V. Но оба эти расширения — кастомные, и, конечно же, в консорциуме RISC-V International задумались о разработке стандартного решения. В этот статье я подробно расскажу, что это за решения и чего от них ожидать. А еще поделюсь последними новостями из мира разреженных матриц.

https://habr.com/ru/companies/yadro/articles/827432/

#riscv #матричные_расширения #расширения #матричные_вычисления #разреженные_матрицы #высокопроизводительные_вычисления

#высокопроизводительные_вычисления #разреженные_матрицы #матричные_вычисления #расширения #матричные_расширения #riscv

#высокопроизводительные_вычисления — Public Fediverse posts