#diffusiongemma — Public Fediverse posts
Live and recent posts from across the Fediverse tagged #diffusiongemma, aggregated by home.social.
-
RT @LottoLabs: DiffusionGemma 26B-A4B mit llama.cpp-Fork. Dies ist ein gutes Beispiel dafür, wie Diffusionsmodelle einen Textblock parallel im Gegensatz zum nächsten Token generieren. Allerdings muss ich auf bessere Server-Unterstützung für llama.cpp warten oder zu vllm oder ktransformers wechseln, um tatsächliche Auswertungen etc. durchzuführen. Video.
mehr auf Arint.info
#AI #DiffusionGemma #DiffusionModels #ktransformers #llama #vllm #arint_info
-
RT @LottoLabs: DiffusionGemma 26B-A4B mit llama.cpp-Fork. Dies ist ein gutes Beispiel dafür, wie Diffusionsmodelle einen Textblock parallel im Gegensatz zum nächsten Token generieren. Allerdings muss ich auf bessere Server-Unterstützung für llama.cpp warten oder zu vllm oder ktransformers wechseln, um tatsächliche Auswertungen etc. durchzuführen. Video.
mehr auf Arint.info
#AI #DiffusionGemma #DiffusionModels #ktransformers #llama #vllm #arint_info
-
https://winbuzzer.com/2026/06/11/google-diffusiongemma-trades-quality-for-local-ai-speed-xcxwbn/
Google has introduced DiffusionGemma to speed local AI output through parallel text diffusion, but lower quality than Gemma 4 keeps trade-offs visible.
#AI #DiffusionGemma #TextDiffusion #Google #GoogleAI #AIModels #OpenSourceAI #OnDeviceAI #AIResearch
-
https://winbuzzer.com/2026/06/11/google-diffusiongemma-trades-quality-for-local-ai-speed-xcxwbn/
Google has introduced DiffusionGemma to speed local AI output through parallel text diffusion, but lower quality than Gemma 4 keeps trade-offs visible.
#AI #DiffusionGemma #TextDiffusion #Google #GoogleAI #AIModels #OpenSourceAI #OnDeviceAI #AIResearch
-
👀 DiffusionGemma: Google lancia un nuovo modello open source per esecuzione in locale che elabora 256 token in parallelo, usa attention bidirezionale e si auto-corregge in tempo reale.
https://gomoot.com/diffusiongemma-il-nuovo-modello-open-source-di-google/ -
Google、ローカルAIが4倍速くなるテキスト生成モデル「DiffusionGemma」を実験的に発表、逐次ではなく一括で生成/「GeForce RTX 5090」で700トークン/秒超を達成
https://forest.watch.impress.co.jp/docs/news/2116179.html#forest_watch_impress #Gemma #Google_DeepMind #Gemma_4 #DiffusionGemma #genai #文章生成 #AIコーディング #Gemini