Perplexity AI推出混合本地-云端推理系统

Perplexity AI在2026年台北国际电脑展上推出了一款开创性的混合本地-服务器推理编排器，承诺从根本上改变AI工作负载的部署方式。该公司将这一系统称为“EdgeMind”，它能实时自主决定是在用户的本地设备上运行AI任务，还是在云端运行，从而优化性能、隐私和成本。这与当前范式截然不同——当前AI推理要么完全基于云端（需要持续的网络连接并引发隐私问题），要么完全在设备端（受硬件能力限制）。EdgeMind动态评估每个请求，考虑模型大小、延迟要求、数据敏感性以及当前网络状况等因素。例如，像总结本地文档这样的简单查询可能完全在用户的笔记本电脑上处理，确保隐私和零延迟。而像生成高分辨率图像或分析大型数据集这样的复杂任务，则会无缝卸载到云端，那里有更强大的GPU可用。这种转换对用户来说是无感的，用户只需看到结果出现。 Perplexity AI首席执行官Aravind Srinivas在台北国际电脑展的主题演讲中表示：“我们相信，AI的未来不是纯云端或纯设备端，而是两者之间的流畅协作。EdgeMind就是这种协作的操作系统。它做出艰难的决定，这样用户就不必操心了。” 该系统设计用于处理各种模型，从可在手机上运行的小型语言模型到需要数据中心集群的前沿模型。Perplexity还发布了一个软件开发工具包，允许第三方开发者将EdgeMind集成到他们自己的应用程序中。早期演示显示了令人印象深刻的结果。在一次测试中，一台运行EdgeMind的笔记本电脑处理了70%的本地AI查询，将云端成本降低了60%，同时将响应时间保持在200毫秒以内。隐私敏感型任务，例如处理邮件，也得到了妥善处理。

Perplexity AI推出混合本地-云端推理系统

相关资讯