Model Update2026-07-02Microsoft Research Blog

微軟 SkillOpt 登場:把 AI 代理技能變成可訓練參數

微軟研究院發表了一項名為 SkillOpt 的創新方法,徹底改變了過去編輯與改進 AI 代理技能的方式。不同於手動調整提示詞或對整個模型進行微調,SkillOpt 將每個代理技能視為可訓練的參數,並透過正式的訓練流程來優化這些技能。 這項技術解決了建構可靠 AI 代理時最棘手的挑戰之一:如何在不影響模型原有通用能力的前提下,改善特定行為。傳統做法往往需要重新訓練整個模型,或是花費大量心力設計提示詞,這兩種方式不僅耗時,還可能引發非預期的副作用。 SkillOpt 的運作方式是將特定技能——例如代理如何處理客戶投訴或進行金融交易——獨立出來,當作可模組化訓練的元件。開發者可以在不更動核心模型權重的情況下,針對特定領域改善代理行為。最終產出的 AI 代理不僅更可靠、更具適應性,還能隨著新需求出現而持續進步。 這項技術對企業應用尤其重要,因為企業 AI 代理需要在各種不同情境下穩定運作。透過讓技能變得可訓練,微軟為代理開發帶來了更系統化的方法,從過去臨時拼湊的提示詞工程,轉向結構化的優化流程。這可望大幅縮短 AI 代理在生產環境中部署與維護所需的時間與成本。 早期測試顯示,經過 SkillOpt 訓練的代理表現出更一致的行為,也更容易除錯與持續改進。這項研究代表著在打造能可靠部署於高風險商業應用的 AI 系統上,邁出了務實的一步。

相關資訊