Edgee by Edgee AIは、Anthropicがダウン、レート制限、またはプラン上限に達した際に、コード変更なしでGLM、Qwen、Gemma、Kimiなどのモデルに自動的にフォールバックルーティングします。
障害時の自動フォールバック
プライマリモデルが429または5xxエラーを返した場合、Edgeiは即座にチェーン内の次の設定済みフォールバックを通じてリクエストを再試行します。
レート制限時のフォールバック
枯渇したクォータ(週間プラン上限やハードレート制限)を検出し、透過的に利用可能な高速フォールバックモデルにルーティングします。
常時スマートルーティング
コスト最適化やチーム全体の標準化のために、クライアントの元の要求に関係なく、すべてのリクエストを特定のモデルに強制的に送信できます。
6つのEdgeeホストモデル
APIキー不要ですぐに利用可能。Gemma 4 26B、GLM-5、Qwen3 Coder 480B、Kimi K2.5、MiniMax M2.5、Qwen3 Coder Nextを含み、新しいモデルが定期的に追加されます。
BYOKモデル
OpenAI、Anthropic、Mistral、DeepSeek、xAIなど、キー持ち込みをサポートします。
Bring Your Own Cloud
ワンクリックでAWS Bedrock、Google Vertex AI、Azure OpenAIにフォールバック。自社のクラウドアカウントと認証情報を使用します。
マルチリージョンBedrockサポート
リージョンごとにAWSアクセスキーを貼り付けると、EdgeeがAWSアカウント内のBedrockモデルにルーティングします。
Vertex AIサービスアカウント
Google Cloud ConsoleからサービスアカウントJSONを貼り付けて、フォールバックルーティングを有効にします。
Azure OpenAIエンドポイント
エンドポイント+APIキーでAzureベースのフォールバックを設定します。
ライブ認証情報テスト
認証情報はアクティブになる前にライブでテストされ、信頼性を確保します。
Edgee by Edgee AIは、Anthropicがダウン、レート制限、またはプラン上限に達した際に、コード変更なしでGLM、Qwen、Gemma、Kimiなどのモデルに自動的にフォールバックルーティングします。
分類:アグリゲーションプラットフォーム
アクセスリンク:https://www.edgee.ai/fallback-models
タグ:Anthropicフォールバック、AI冗長性、LLMルーティング、APIフェイルオーバー、マルチモデルAI