AI Infrastructure2026-05-21
VentureBeat
Cerebras 運行萬億參數模型,速度比 GPU 快 7 倍
Cerebras Systems 宣布了一項重大的效能里程碑,聲稱其晶片運行 Kimi K2.6——一個萬億參數的開放權重 AI 模型——的速度比傳統 GPU 雲端快近七倍。這項公告緊隨 Cerebras 完成 2026 年最大的科技公司 IPO 之後,標誌著該公司積極進軍 AI 推理市場。
這項效能聲明意義重大,因為它挑戰了 GPU 基礎設施的主導地位,而 GPU 一直是 AI 訓練和推理的標準。Cerebras 的晶圓級晶片設計與傳統 GPU 不同,它使用一個巨大的單一矽晶圓來創建一個高度互連的運算平台。這種架構允許更快的資料移動和更低的延遲,這對於高效運行大型 AI 模型至關重要。
擁有萬億參數的 Kimi K2.6 代表了現有最大的開放權重 AI 模型之一。大規模運行這樣的模型需要巨大的運算資源,而 Cerebras 聲稱比 GPU 雲端快 7 倍的速度提升,對於需要快速推理以用於即時聊天機器人、程式碼生成或科學研究等應用的組織來說,可能是一個遊戲規則的改變者。
此公告的時機具有戰略意義。憑藉最近的 IPO,Cerebras 籌集了大量資金來擴大其製造和銷售工作。該公司將自己定位為 NVIDIA 和其他 GPU 供應商的直接競爭對手,目標客戶是那些對 GPU 短缺、高成本和效能瓶頸感到沮喪的客戶。
業界觀察家將密切關注 Cerebras 是否能在實際部署中兌現其效能承諾。如果成功,該公司可能會顛覆 AI 硬體市場,並為基於 GPU 的基礎設施提供可行的替代方案。目前,Cerebras 正大力押注其晶圓級技術將成為 AI 運算的未來。
