NVIDIA 加速 Google DeepMind 的 DiffusionGemma，實現本地 AI 運算

Google DeepMind 推出了 DiffusionGemma，這是一個專為快速文字生成而設計的實驗性開源模型。現在，NVIDIA 已介入並大幅提升其效能，使其在 GeForce RTX GPU、RTX PRO 平台和 DGX Spark 系統上運行速度顯著加快。這項最佳化讓開發人員和研究人員能夠在本地執行高速推論，範圍涵蓋從個人電腦到雲端基礎設施的各種環境。 DiffusionGemma 代表了朝向更高效文字生成的轉變，它採用基於擴散的技術，而非傳統的自迴歸方法。透過與 NVIDIA 合作，Google DeepMind 旨在普及對強大 AI 工具的存取，這些工具無需持續的網路連線或依賴遠端伺服器即可運作。在 NVIDIA 硬體上提升的速度意味著，即時內容創作、互動式聊天機器人和快速原型設計等複雜任務，現在可以在消費級裝置上實現。對使用者而言，這意味著更低的延遲和降低的營運成本，因為本地推論消除了對昂貴雲端訂閱的需求。NVIDIA 在最佳化該模型方面的角色包括微調核心運算和記憶體管理，確保即使是入門級的 RTX 顯示卡也能有效處理 DiffusionGemma。這項合作凸顯了一個更廣泛的產業趨勢：將企業級 AI 能力帶到邊緣端，在邊緣端，隱私和速度至關重要。隨著 AI 模型變得越來越複雜，在本地強大的 GPU 上運行它們的能力將成為一個關鍵的差異化因素。隨著 DiffusionGemma 現在已針對 NVIDIA 生態系統進行最佳化，開發人員可以期待從開發到部署的無縫體驗，無論他們是在建構個人助理、教育工具還是創意應用程式。

NVIDIA 加速 Google DeepMind 的 DiffusionGemma，實現本地 AI 運算

相關資訊