Model Update2026-05-08VentureBeat

Sakana 训练 7B 模型来编排顶级 AI 模型

Sakana AI 推出了“RL Conductor”,这是一种创新的方法来管理现代 AI 管道的复杂性。这是一个紧凑的 70 亿参数模型,通过强化学习训练而成。这个虽小但功能强大的模型旨在编排对更大、更强大的 AI 模型(如 GPT-5、Claude Sonnet 4 和 Gemini 2.5 Pro)的调用。其目标是通过动态地将每个查询路由到最合适的模型,来消除困扰传统 LangChain 管道的瓶颈和低效问题,从而提高效率和适应性。 RL Conductor 解决的核心问题是许多 AI 编排框架的“一刀切”方法。在典型的 LangChain 设置中,开发人员可能会硬编码哪个模型用于特定任务,或者使用简单的基于规则的系统。这通常会导致次优性能,因为一个快速的小模型可能完全足以处理简单查询,而复杂的推理任务可能需要前沿模型的全部能力。RL Conductor 通过充当智能路由器来解决这个问题。它通过强化学习训练,能够评估传入的请求,并实时确定哪个可用的更大模型最适合处理它,从而平衡准确性、成本和延迟等因素。 这种方法特别引人注目的是其效率。RL Conductor 只有 70 亿个参数,轻量级到足以在普通硬件上运行,但它可以管理比其大几个数量级的模型的输出。这意味着公司可以部署一个单一的智能网关来优化其 AI 资源使用,而无需投资于大规模基础设施。强化学习训练过程允许模型通过试错来学习最优路由策略,有效地发现人类工程师可能错过的查询类型和模型性能模式。 Sakana AI 的创新代表了朝着更智能的 AI 系统迈出的重要一步。

相关资讯

更多 AI 资讯

AIStart.ai · 你的专属 AI 启动台