Model Update2026-07-02
Microsoft Research Blog
微软SkillOpt:把AI Agent技能变成可训练参数
微软研究院最近推出了一个叫SkillOpt的创新方法,彻底改变了AI Agent技能的编辑和改进方式。以前要么手动调提示词,要么对整个模型做微调,现在SkillOpt直接把单个Agent技能变成了可训练参数,通过正式的训练流程来优化。
这招解决了一个长期困扰AI Agent开发者的核心问题:怎么在不影响模型通用能力的前提下,改进特定行为。传统方法要么重新训练整个模型,要么精心设计提示词,既费时又容易带来意想不到的副作用。
SkillOpt的工作原理是把特定技能——比如Agent怎么处理客户投诉、怎么处理金融交易——拆成独立的模块,然后单独训练。这意味着开发者可以在不改动核心模型权重的情况下,精准提升Agent在特定场景下的表现。结果是Agent更可靠、更灵活,还能随着新需求不断迭代。
这项技术对企业级应用特别有价值,因为AI Agent需要在各种场景下稳定运行。通过让技能变得可训练,微软把Agent开发从零散的提示词工程变成结构化的优化流程。这能大大降低部署和维护AI Agent的时间和成本。
早期测试显示,用SkillOpt训练出来的Agent行为更一致,调试和改进也更方便。这项研究是朝着构建能在高风险商业场景中可靠部署的AI系统迈出的实际一步。