支出追跡
OpenAI、Azure、Bedrock、GCPなどのプロバイダー間で自動追跡し、キー/ユーザー/チーム/組織にコストを割り当て。タグベースの支出追跡も可能。
予算とレート制限
キーごとまたはチームごとの予算を設定し、RPM/TPM制限を適用して使用量を制御。
OpenAI互換API
すべてのリクエストがOpenAIフォーマットを使用するため、開発者はプロバイダー間で入出力を変換する必要がありません。
LLMフォールバック
プライマリプロバイダーが利用できない場合、自動的に代替モデルにフォールバックする設定が可能。
仮想キーとチーム
仮想APIキーの作成、チーム管理、大規模な予算割り当て。
LLMガードレール
安全性とコンプライアンスのためにLLM出力をフィルタリングまたは変更するガードレールを適用。
バッチAPIサポート
効率化のために複数のリクエストをバッチ処理。
パススルーエンドポイント
必要に応じてリクエストを直接基盤プロバイダーに転送。
プロンプト管理
Hugging Faceモデルを含む異なるモデル向けにプロンプトを手動変換なしでフォーマット。
S3ログ記録
すべての支出と使用データをS3、GCSなどのクラウドストレージに記録し監査に対応。
Berri AIのLLM Gatewayは、OpenAI形式で100以上のLLMの認証、負荷分散、支出追跡を管理します。
分類:アグリゲーションプラットフォーム
アクセスリンク:https://litellm.ai/
タグ:LLMゲートウェイ、OpenAI形式、支出追跡、負荷分散、マルチLLM管理