#gpu — Public Fediverse posts on home.social

Magyarország @[email protected] · 2026-05-27 · 15:02 UTC

https://www.europesays.com/hu/115565/ Hiába a gyenge eredmények, hatalmas siker a kínai GPU #gpu #HU #Hungarian #Hungary #LisuanTechLx7g100 #Magyar #Magyarország #Science #Science&Technology #Technológia #Technology #Tudomány #TudományésTechnológia #videókártya

#videokartya #tudomanyestechnologia #tudomany #technology #technologia #science

Vulkan @vulkan · 2026-05-27 · 13:31 UTC

Vulkan has published a new sample demonstrating Shader Execution Reordering (SER) for ray tracing.

SER separates ray traversal from shader invocation, letting the GPU reorder threads for better coherency before execution. The sample includes an interactive on/off toggle across three divergent material types, with real-world gains ranging from 11-24% in path tracing to 40-50% in high-divergence scenarios.

https://github.com/KhronosGroup/Vulkan-Samples/tree/main/samples/extensions/ray_tracing_invocation_reorder
#RayTracing #GPU #GraphicsProgramming #Khronos

#raytracing #gpu #graphicsprogramming #khronos

Hacker News @[email protected] · 2026-05-27 · 13:18 UTC

Matrix Multiplications on GPUs Run Faster When Given "Predictable" Data

https://www.thonking.ai/p/strangely-matrix-multiplications

#HackerNews #MatrixMultiplication #GPU #Performance #PredictableData #TechInnovation #AIResearch

#hackernews #matrixmultiplication #gpu #performance #predictabledata #techinnovation

Habr @[email protected] · 2026-05-27 · 12:12 UTC

[Перевод] Дезагрегированный инференс LLM в Kubernetes: префилл, декодирование и планирование подов

С ростом сложности рабочих нагрузок инференса больших языковых моделей (LLM) единый монолитный процесс обслуживания упирается в свои пределы. У префилла и декодирования принципиально разные профили вычислений, но традиционные развёртывания заставляют их работать на одном оборудовании. В итоге GPU недозагружены, а масштабирование — негибкое. Дезагрегированный инференс решает эту проблему: разбивает конвейер на отдельные этапы — префилл, декодирование и маршрутизацию. Каждый этап работает как независимый сервис, который можно обеспечивать ресурсами и масштабировать на собственных условиях. Команда VK Cloud перевела статью, в которой разбирается, как развернуть дезагрегированный инференс в Kubernetes. Здесь мы посмотрим на разные решения экосистемы, как они работают в кластере и что дают «из коробки».

https://habr.com/ru/companies/vktech/articles/1040076/

#vk_cloud #llm #kubernetes #inference #gpu #nvidia #дезагрегированный_инференс #оркестрация #автомасштабирование #планирование_подов

#планирование_подов #автомасштабирование #оркестрация #дезагрегированный_инференс #nvidia #gpu

Habr @[email protected] · 2026-05-27 · 12:12 UTC

[Перевод] Дезагрегированный инференс LLM в Kubernetes: префилл, декодирование и планирование подов

С ростом сложности рабочих нагрузок инференса больших языковых моделей (LLM) единый монолитный процесс обслуживания упирается в свои пределы. У префилла и декодирования принципиально разные профили вычислений, но традиционные развёртывания заставляют их работать на одном оборудовании. В итоге GPU недозагружены, а масштабирование — негибкое. Дезагрегированный инференс решает эту проблему: разбивает конвейер на отдельные этапы — префилл, декодирование и маршрутизацию. Каждый этап работает как независимый сервис, который можно обеспечивать ресурсами и масштабировать на собственных условиях. Команда VK Cloud перевела статью, в которой разбирается, как развернуть дезагрегированный инференс в Kubernetes. Здесь мы посмотрим на разные решения экосистемы, как они работают в кластере и что дают «из коробки».

https://habr.com/ru/companies/vktech/articles/1040076/

#vk_cloud #llm #kubernetes #inference #gpu #nvidia #дезагрегированный_инференс #оркестрация #автомасштабирование #планирование_подов

#планирование_подов #автомасштабирование #оркестрация #дезагрегированный_инференс #nvidia #gpu

Habr @[email protected] · 2026-05-27 · 12:12 UTC

[Перевод] Дезагрегированный инференс LLM в Kubernetes: префилл, декодирование и планирование подов

С ростом сложности рабочих нагрузок инференса больших языковых моделей (LLM) единый монолитный процесс обслуживания упирается в свои пределы. У префилла и декодирования принципиально разные профили вычислений, но традиционные развёртывания заставляют их работать на одном оборудовании. В итоге GPU недозагружены, а масштабирование — негибкое. Дезагрегированный инференс решает эту проблему: разбивает конвейер на отдельные этапы — префилл, декодирование и маршрутизацию. Каждый этап работает как независимый сервис, который можно обеспечивать ресурсами и масштабировать на собственных условиях. Команда VK Cloud перевела статью, в которой разбирается, как развернуть дезагрегированный инференс в Kubernetes. Здесь мы посмотрим на разные решения экосистемы, как они работают в кластере и что дают «из коробки».

https://habr.com/ru/companies/vktech/articles/1040076/

#vk_cloud #llm #kubernetes #inference #gpu #nvidia #дезагрегированный_инференс #оркестрация #автомасштабирование #планирование_подов

#планирование_подов #автомасштабирование #оркестрация #дезагрегированный_инференс #nvidia #gpu

Habr @[email protected] · 2026-05-27 · 12:12 UTC

[Перевод] Дезагрегированный инференс LLM в Kubernetes: префилл, декодирование и планирование подов

С ростом сложности рабочих нагрузок инференса больших языковых моделей (LLM) единый монолитный процесс обслуживания упирается в свои пределы. У префилла и декодирования принципиально разные профили вычислений, но традиционные развёртывания заставляют их работать на одном оборудовании. В итоге GPU недозагружены, а масштабирование — негибкое. Дезагрегированный инференс решает эту проблему: разбивает конвейер на отдельные этапы — префилл, декодирование и маршрутизацию. Каждый этап работает как независимый сервис, который можно обеспечивать ресурсами и масштабировать на собственных условиях. Команда VK Cloud перевела статью, в которой разбирается, как развернуть дезагрегированный инференс в Kubernetes. Здесь мы посмотрим на разные решения экосистемы, как они работают в кластере и что дают «из коробки».

https://habr.com/ru/companies/vktech/articles/1040076/

#vk_cloud #llm #kubernetes #inference #gpu #nvidia #дезагрегированный_инференс #оркестрация #автомасштабирование #планирование_подов

#vk_cloud #llm #kubernetes #inference #gpu #nvidia

RedPacket Security @[email protected] · 2026-05-27 · 10:02 UTC

From poisoned search results to GPU mining: A cryptojacking campaign abusingScreenConnect and Microsoft .NET utilities - https://www.redpacketsecurity.com/from-poisoned-search-results-to-gpu-mining-a-cryptojacking-campaign-abusingscreenconnect-and-microsoft-net-utilities/

#threatintel
#cryptojacking
#GPU-mining
#ScreenConnect abuse
#DLL sideloading
#process hollowing

#threatintel #cryptojacking #gpu #screenconnect #dll #process

RedPacket Security @[email protected] · 2026-05-27 · 10:02 UTC

From poisoned search results to GPU mining: A cryptojacking campaign abusingScreenConnect and Microsoft .NET utilities - https://www.redpacketsecurity.com/from-poisoned-search-results-to-gpu-mining-a-cryptojacking-campaign-abusingscreenconnect-and-microsoft-net-utilities/

#threatintel
#cryptojacking
#GPU-mining
#ScreenConnect abuse
#DLL sideloading
#process hollowing

#threatintel #cryptojacking #gpu #screenconnect #dll #process

RedPacket Security @[email protected] · 2026-05-27 · 10:02 UTC

From poisoned search results to GPU mining: A cryptojacking campaign abusingScreenConnect and Microsoft .NET utilities - https://www.redpacketsecurity.com/from-poisoned-search-results-to-gpu-mining-a-cryptojacking-campaign-abusingscreenconnect-and-microsoft-net-utilities/

#threatintel
#cryptojacking
#GPU-mining
#ScreenConnect abuse
#DLL sideloading
#process hollowing

#threatintel #cryptojacking #gpu #screenconnect #dll #process

RedPacket Security @[email protected] · 2026-05-27 · 10:02 UTC

From poisoned search results to GPU mining: A cryptojacking campaign abusingScreenConnect and Microsoft .NET utilities - https://www.redpacketsecurity.com/from-poisoned-search-results-to-gpu-mining-a-cryptojacking-campaign-abusingscreenconnect-and-microsoft-net-utilities/

#threatintel
#cryptojacking
#GPU-mining
#ScreenConnect abuse
#DLL sideloading
#process hollowing

#process #dll #screenconnect #gpu #cryptojacking #threatintel

RedPacket Security @[email protected] · 2026-05-27 · 10:02 UTC

From poisoned search results to GPU mining: A cryptojacking campaign abusingScreenConnect and Microsoft .NET utilities - https://www.redpacketsecurity.com/from-poisoned-search-results-to-gpu-mining-a-cryptojacking-campaign-abusingscreenconnect-and-microsoft-net-utilities/

#threatintel
#cryptojacking
#GPU-mining
#ScreenConnect abuse
#DLL sideloading
#process hollowing

#threatintel #cryptojacking #gpu #screenconnect #dll #process

Habr @[email protected] · 2026-05-27 · 07:22 UTC

[Перевод] Масштабирование LLM: от одного чипа до ЦОДа. Глава 3. Траснформеры

Это продолжение цикла статей о масштабировании тренировки и инференса LLM. Предыдущая статья А теперь перейдем к чему-то более практическому, а именно к тому, сколько нужно FLOPs и байт для работы трансформера. Подразумевается, что у вас уже есть представление о том, что такое архитектура трансформера, как работает механизм внимания и т.д. Давайте начнем с векторов x, y и матриц A, B, имеющих вот такие размеры, допустим один элемент занимает при этом один байт.

https://habr.com/ru/articles/1039208/

#ai #ml #gpu #gpu_вычисления #трансформеры #анализ_и_проектирование_систем

#анализ_и_проектирование_систем #трансформеры #gpu_вычисления #gpu #ml #ai

:rss: PC Watch @[email protected] · 2026-05-27 · 03:42 UTC

【やじうまPC Watch】中国製GPU「LX 7G100」、48時間で予約が3万台超え。初回分1,000台は完売
https://pc.watch.impress.co.jp/docs/news/yajiuma/2112016.html

#impress #半導体_周辺機器 #GPU #その他 #記事集約用 #やじうま

#impress #半導体_周辺機器 #gpu #その他 #記事集約用 #やじうま

:rss: PC Watch @[email protected] · 2026-05-27 · 01:36 UTC

さよならNVIDIAコントロールパネル。NVIDIA App完全移行で約20年の歴史に幕
https://pc.watch.impress.co.jp/docs/news/2111926.html

#impress #半導体_周辺機器 #GPU #NVIDIA

#impress #半導体_周辺機器 #gpu #nvidia

Mastahhh Gaming Network @[email protected] · 2026-05-26 · 17:19 UTC

Can Your PC Run GTA 6? Expected System Requirements

Wondering if your PC can run GTA 6? Check the expected GTA 6 system requirements for PC, including GPU, RAM, SSD, and performance tips.

#gta #6 #pc #requirements #system #can #my #run #specs #recommended #minimum #gpu #ram #performance #dlss

#gta #pc #requirements #system #can #my