
Google hat DiffusionGemma veröffentlicht, ein offenes Mixture-of-Experts-Modell mit 26 Milliarden Parametern, das Text via Textdiffusion bis zu viermal schneller als konventionelle Sprachmodelle erzeugt. Während der Inferenz werden nur 3,8 Milliarden Parameter aktiviert, so dass das quantisierte Modell in 18 GB VRAM von High-End-Consumer-GPUs passt und auf einer NVIDIA H100 über 1.000 Tokens/s erreicht. DiffusionGemma generiert 256 Tokens parallel mit bidirektionaler Attention und iterativer Selbstkorrektur, liefert jedoch eine etwas geringere Ausgabequalität als Standard-Gemma-4-Modelle. Google veröffentlichte das Modell unter Apache-2.0 auf Hugging Face und optimierte Leistung und Kompatibilität gemeinsam mit NVIDIA für Consumer- und Enterprise-Hardware.
Quelle: Parqet-News
Feed-Zeitpunkt: 2026-06-10T17:00:28.000Z
Disclaimer

Die Inhalte dienen ausschließlich der Information und Finanzbildung. Sie stellen keine Anlageberatung, keine Finanzberatung und keine Aufforderung zum Kauf oder Verkauf von Finanzinstrumenten dar. Investieren ist mit Risiken verbunden, bis hin zum Totalverlust.



