Model Update2026-04-29NVIDIA AI Blog

NVIDIA 推出 Nemotron 3 Nano Omni 多模態模型

NVIDIA 已正式推出 Nemotron 3 Nano Omni,這是一款開創性的開放多模態模型,將視覺、音訊和語言處理整合到一個單一且連貫的系統中。此發展標誌著與傳統 AI 架構的重大背離,傳統架構需要為每種模態分別使用獨立模型,這在協調不同系統時常導致延遲增加和上下文遺失。 Nemotron 3 Nano Omni 旨在透過整合先前分散的能力來簡化 AI 代理工作流程。透過整合視覺、音訊和語言處理,該模型能夠處理並回應多模態輸入,而無需在專門模型之間切換的開銷。此整合對於虛擬助手、自主代理和即時互動系統等應用尤其有益,因為在這些應用中,速度和上下文連貫性至關重要。 新模型的一大亮點是其效率。NVIDIA 聲稱,與傳統的多模態設置相比,Nemotron 3 Nano Omni 可將性能提升高達 9 倍。此效率提升是透過優化架構和減少計算冗餘實現的,使 AI 代理能夠更無縫地處理複雜互動。例如,配備此模型的自主代理可以同時解讀來自攝影機的視覺線索、處理語音指令,並在沒有明顯延遲的情況下生成適當的語言回應。 該模型的開放性是另一個關鍵方面。透過開放發布,NVIDIA 邀請開發者和研究人員進行實驗、自訂,並將該模型整合到他們自己的系統中。這種方法不僅加速了創新,還促進了圍繞多模態 AI 的社群驅動生態系統。 在實際應用中,Nemotron 3 Nano Omni 可以改變從客戶服務到機器人等行業。虛擬助手可以透過理解手勢和語調變得更加直觀,同時

相关资讯

更多 AI 资讯

AIStart.ai · 你的专属 AI 启动台