多供應商大型語言模型存取
透過單一閘道器,讓開發者存取 OpenAI、Azure、Gemini、Bedrock 及 Anthropic 的模型。
成本追蹤與費用分攤
將成本歸因於金鑰、使用者、團隊或組織,精確計算各團隊的大型語言模型使用費用。
預算與速率限制管理
設定預算及速率限制(每分鐘請求數/每分鐘令牌數),以控制支出並防止過度使用。
大型語言模型備援
當主要供應商故障或超載時,自動將請求路由至替代模型。
可觀測性與日誌記錄
將用量記錄至 S3、GCS 或其他儲存空間,並整合 Langfuse、Arize Phoenix、Langsmith 及 OpenTelemetry 等可觀測性工具。
提示詞管理
管理並格式化提示詞,支援 Hugging Face 模型。
企業級存取控制
使用 JWT 驗證、單一登入及稽核日誌,確保大型組織中大型語言模型存取的安全性與合規性。
用量追蹤
自動追蹤 OpenAI、Azure、Bedrock、GCP 及其他供應商的成本,並歸因至金鑰、使用者、團隊或組織,同時支援標籤式用量追蹤。
預算與速率限制
為每個金鑰或團隊設定預算,並強制執行每分鐘請求數/每分鐘令牌數限制,以控制用量。
與 OpenAI 相容的 API
所有請求皆使用 OpenAI 格式,開發者無需在不同供應商之間轉換輸入或輸出。
大型語言模型備援
設定自動備援機制,當主要供應商無法使用時,切換至替代模型。
虛擬金鑰與團隊
建立虛擬 API 金鑰、管理團隊,並大規模分配預算。
大型語言模型護欄
套用護欄機制,過濾或修改大型語言模型的輸出,以確保安全與合規。
批次 API 支援
批次處理多個請求,提升效率。
直通端點
必要時直接將請求轉發至底層供應商。
提示詞管理
為不同模型(包括 Hugging Face 模型)格式化提示詞,無需手動轉換。
S3 日誌記錄
將所有用量與使用資料記錄至 S3、GCS 或其他雲端儲存空間,以供稽核。
Berri AI 的 LLM Gateway,用於管理 100 多個 LLM 的身份驗證、負載平衡和支出追蹤,全部採用 OpenAI 格式。
分类:聚合平台
访问链接:https://litellm.ai/
标签:LLM 閘道、OpenAI 格式、花費追蹤、負載平衡、多 LLM 管理