
Open Source2026-06-11
NVIDIA AI Blog
NVIDIA 加速 Google DeepMind 的 DiffusionGemma,實現本地 AI 運算
Google DeepMind 推出了 DiffusionGemma,這是一個專為快速文字生成而設計的實驗性開源模型。現在,NVIDIA 已介入並大幅提升其效能,使其在 GeForce RTX GPU、RTX PRO 平台和 DGX Spark 系統上運行速度顯著加快。這項最佳化讓開發人員和研究人員能夠在本地執行高速推論,範圍涵蓋從個人電腦到雲端基礎設施的各種環境。
DiffusionGemma 代表了朝向更高效文字生成的轉變,它採用基於擴散的技術,而非傳統的自迴歸方法。透過與 NVIDIA 合作,Google DeepMind 旨在普及對強大 AI 工具的存取,這些工具無需持續的網路連線或依賴遠端伺服器即可運作。在 NVIDIA 硬體上提升的速度意味著,即時內容創作、互動式聊天機器人和快速原型設計等複雜任務,現在可以在消費級裝置上實現。
對使用者而言,這意味著更低的延遲和降低的營運成本,因為本地推論消除了對昂貴雲端訂閱的需求。NVIDIA 在最佳化該模型方面的角色包括微調核心運算和記憶體管理,確保即使是入門級的 RTX 顯示卡也能有效處理 DiffusionGemma。這項合作凸顯了一個更廣泛的產業趨勢:將企業級 AI 能力帶到邊緣端,在邊緣端,隱私和速度至關重要。
隨著 AI 模型變得越來越複雜,在本地強大的 GPU 上運行它們的能力將成為一個關鍵的差異化因素。隨著 DiffusionGemma 現在已針對 NVIDIA 生態系統進行最佳化,開發人員可以期待從開發到部署的無縫體驗,無論他們是在建構個人助理、教育工具還是創意應用程式。