#cutlass — Public Fediverse posts
Live and recent posts from across the Fediverse tagged #cutlass, aggregated by home.social.
-
NVIDIA wprowadza CuTe DSL w CUTLASS 4 – Python zbliża się do C++ w wydajności
Czy da się dogonić C++ wydajnością, pisząc w Pythonie – i to bez czarów, bez sugar-coata i bez tygodni czekania na kompilację? NVIDIA twierdzi, że tak: nowy CuTe DSL w CUTLASS 4 obiecuje „C++-owe” osiągi Tensor Cores z wygodą pythonowych API.
Czytaj dalej:
https://pressmind.org/nvidia-wprowadza-cute-dsl-w-cutlass-4-python-zbliza-sie-do-c-w-wydajnosci/ -
Fp8 runs ~100 tflops faster when the kernel name has "cutlass" in it
https://github.com/triton-lang/triton/pull/7298
#HackerNews #Fp8 #cutlass #tflops #performance #optimization #HackerNews #triton
-
FP8 is ~100 tflops faster when the kernel name has "cutlass" in it
https://twitter.com/cis_female/status/1943069934332055912
#HackerNews #FP8 #tflops #cutlass #performance #optimization #AI