Perplexity AI 推出混合本地-雲端推理系統

Perplexity AI 在 Computex 2026 上推出了一款突破性的混合式本地-伺服器推理協調器，承諾從根本上改變AI工作負載的部署方式。該公司將此系統命名為「EdgeMind」，它能即時自主決定AI任務是在使用者的本地裝置上執行，還是在雲端執行，從而最佳化效能、隱私和成本。這與當前的範例有顯著不同，當前AI推理要麼完全基於雲端（需要持續的網路連線並引發隱私問題），要麼完全在裝置上執行（受限於硬體能力）。EdgeMind 會動態評估每個請求，考慮模型大小、延遲需求、資料敏感性以及當前網路狀況等因素。例如，像摘要本地文件這樣的簡單查詢可能會完全在使用者的筆記型電腦上處理，確保隱私和零延遲。而像生成高解析度圖像或分析大型資料集這樣的複雜任務，則會無縫卸載到雲端，在那裡有更強大的GPU可用。對使用者而言，這個轉換是無感的，他們只會看到結果出現。「我們相信AI的未來不是僅限雲端或僅限裝置，而是兩者之間的流暢合作，」Perplexity AI 執行長 Aravind Srinivas 在 Computex 主題演講中表示。「EdgeMind 就是這種合作的作業系統。它做出艱難的決定，這樣使用者就不必費心。」該系統設計用於與多種模型配合使用，從可以在手機上執行的小型語言模型，到需要資料中心叢集的尖端模型。Perplexity 還發布了一個軟體開發套件，允許第三方開發者將 EdgeMind 整合到他們自己的應用程式中。早期的展示顯示了令人印象深刻的結果。在一項測試中，一台運行 EdgeMind 的筆記型電腦在本地處理了70%的AI查詢，將雲端成本降低了60%，同時將回應時間維持在200毫秒以下。對於處理隱私敏感任務，例如處理個

Perplexity AI 推出混合本地-雲端推理系統

相关资讯