#flashattention — Public Fediverse posts on home.social

deepseek @[email protected] · 2026-03-28 · 00:18 UTC

谷歌一篇论文砸崩内存巨头？不懂“显存墙”，怎么做 AI 时代的工程师！本文永久链接 – https://tonybai.com/2026/03/28/ai-engineer-gpu-introduction-course 大家好...

#技术志 #AIModel #AI模型 #ArtificialIntelligence #AttentionMechanism #ComputeBound #ComputingPower #CUDA #FlashAttention #FP8 #Go

Origin | Interest | Match

#技术志 #aimodel #ai模型 #artificialintelligence #attentionmechanism #computebound

Habr @[email protected] · 2026-02-06 · 19:02 UTC

Triton, Flash-attension, Sage-attension и bitsandbytes с Rocm7 в Windows

В конце января 2026 вышел triton-windows 3.6.0.post25 , который позволяет использовать flash-attention , sage-attention (v1) и другие библиотеки, использующие Triton, на картах AMD с поддержкой rocWMMA в Windows. Также, несмотря на то, что в официальном репозитории bitsandbytes еще не приняли PR для поддержки ROCm 7, его все же можно собрать, внеся небольшие изменения в код. Эти изменения я уже сделал в своем форке. В этой статье я расскажу, как установить все это себе, а также для примера запустим пару тестов в ComfyUI, в том числе со свежей LTX-2, и сделаем Qlora адаптер для модели Gemma 3.

https://habr.com/ru/articles/987672/

#triton #amd #rx7900 #sageattention #flashattention #bitsandbytes #rocm #rocm7 #comfyui #ltx2