AI Infrastructure2026-05-01
MIT Technology Review
Goodfire 推出 Silico 工具,用於除錯大型語言模型
專注於 AI 透明度的新創公司 Goodfire 發布了一款名為 Silico 的突破性工具,有望改變開發者理解與控制大型語言模型(LLM)的方式。Silico 是一款機械可解釋性工具,允許研究人員和工程師窺探 AI 模型的「黑箱」,並在訓練過程中調整其內部參數。這提供了前所未有的精細控制層級,以掌控模型行為。
傳統上,訓練 LLM 有點像一場猜謎遊戲。開發者輸入資料並調整高層級設定,但模型為何做出特定決策的內部運作仍然不透明。Silico 透過提供一個進入模型神經網路的窗口來改變這一點。使用者可以識別負責特定行為的特定電路或神經元,並直接對其進行微調。這意味著,如果模型產生了有偏見或不正確的輸出,開發者可以精確定位確切原因,並從源頭修正。
這款工具代表了 AI 透明度與安全性的一次重大飛躍。透過允許開發者以手術般的精準度除錯模型,Silico 降低了意外後果的風險。它還實現了以往被認為不可能的客製化層級。例如,一家公司可以調整模型,使其在醫療建議上更加謹慎,或在行銷文案上更具創造力,所有這些都透過直接操縱底層機制來完成。
對於更廣泛的 AI 社群而言,Silico 是揭開這些強大模型運作神秘面紗的一步。隨著 LLM 越來越深入地整合到關鍵應用程式中,像 Silico 這樣的工具將對於確保它們可靠、安全且符合人類價值至關重要。Goodfire 實際上為開發者提供了一台顯微鏡和一把手術刀,來剖析 AI 的大腦。
