Product Launch2026-06-03
VentureBeat
Perplexity AI、ハイブリッドローカル・クラウド推論システムを発表
Perplexity AIは、Computex 2026において、画期的なハイブリッドローカルサーバー推論オーケストレーターを発表し、AIワークロードの展開方法を根本的に変えることを約束しました。同社が「EdgeMind」と呼ぶこのシステムは、AIタスクをユーザーのローカルデバイスで実行するかクラウドで実行するかをリアルタイムで自律的に判断し、パフォーマンス、プライバシー、コストを最適化します。
これは、AI推論が完全にクラウドベース(常時インターネット接続が必要でプライバシー上の懸念が生じる)か、完全にオンデバイス(ハードウェアの能力に制限される)のいずれかである現在のパラダイムからの大きな転換です。EdgeMindは各リクエストを動的に評価し、モデルサイズ、レイテンシ要件、データの機密性、現在のネットワーク状況などの要素を考慮します。
例えば、ローカルドキュメントの要約のような単純なクエリは、ユーザーのラップトップ上で完全に処理され、プライバシーが確保され、レイテンシがゼロになります。高解像度画像の生成や大規模データセットの分析のような複雑なタスクは、より強力なGPUが利用可能なクラウドにシームレスにオフロードされます。この移行はユーザーには見えず、単に結果が表示されるだけです。
「私たちは、AIの未来はクラウドのみでもデバイスのみでもなく、両者の流動的なパートナーシップにあると信じています」と、Perplexity AIのCEOであるアラヴィンド・スリニバス氏はComputexの基調講演で述べました。「EdgeMindはそのパートナーシップのためのオペレーティングシステムです。ユーザーがしなくて済むように、難しい判断を下します。」
このシステムは、スマートフォンで動作する小型言語モデルからデータセンタークラスターを必要とするフロンティアモデルまで、幅広いモデルで動作するように設計されています。Perplexityはまた、サードパーティの開発者がEdgeMindを自社のアプリケーションに統合できるソフトウェア開発キットもリリースしました。
初期のデモでは印象的な結果が示されました。あるテストでは、EdgeMindを搭載したラップトップがAIクエリの70%をローカルで処理し、クラウドコストを60%削減しながら、応答時間を200ミリ秒未満に維持しました。プライバシーに敏感なタスク、例えばメールの処理などは、