LiteLLM是Berri AI开发的一个LLM网关，提供统一的OpenAI格式API，用于管理100多种语言模型的认证、负载均衡和支出跟踪。

LiteLLM支持哪些LLM？

LiteLLM支持超过100种LLM，包括OpenAI、Anthropic、Cohere、Hugging Face等，均可通过单一端点访问。

LiteLLM如何处理负载均衡？

LiteLLM根据可配置规则自动将请求分发到多个模型或提供商，确保高可用性和最佳性能。

LiteLLM可以跟踪API支出吗？

是的，LiteLLM提供内置的支出跟踪和日志记录，让您实时监控所有模型和用户的使用情况和成本。

LiteLLM与现有的OpenAI代码兼容吗？

是的，LiteLLM使用OpenAI格式，因此您只需将现有代码中的基础URL替换为LiteLLM端点，无需更改应用程序逻辑。

LiteLLM提供认证管理吗？

是的，LiteLLM包含认证管理功能，如API密钥验证、用户级访问控制和速率限制，以保护您的LLM使用安全。

LiteLLM - AI 聚合平台工具 - 免费试用、价格介绍、性能评测、官网访问与在线体验

LiteLLM 是什么？

LiteLLM 是由 Berri AI 开发、Y Combinator 支持的 AI 网关，提供超过 100 种大语言模型的访问、故障转移和支出追踪功能。它采用 OpenAI 兼容格式，开发者无需重写代码即可在不同提供商间切换。该平台已处理超过 10 亿次请求，累计 2.4 亿次 Docker 拉取，拥有 1005+ 贡献者。它简化了平台团队为开发者提供 OpenAI、Azure、Gemini、Bedrock 和 Anthropic 等大语言模型访问的流程。

Application scenarios

多提供商大语言模型访问
通过单一网关为开发者提供 OpenAI、Azure、Gemini、Bedrock 和 Anthropic 模型访问。
成本追踪与费用分摊
通过将成本归因到密钥、用户、团队或组织，精确核算各团队的 LLM 使用费用。
预算与速率限制管理
设置预算和速率限制（RPM/TPM）以控制支出并防止过度使用。
大语言模型故障转移
当主要提供商故障或过载时，自动将请求路由至备用模型。
可观测性与日志记录
将支出记录至 S3、GCS 或其他存储，并集成 Langfuse、Arize Phoenix、Langsmith 和 OpenTelemetry 等可观测性工具。
提示词管理
管理和格式化提示词，支持 Hugging Face 模型。
企业级访问控制
通过 JWT 认证、SSO 和审计日志，实现大型组织内安全可控的大语言模型访问。

Core Features

支出追踪
自动追踪 OpenAI、Azure、Bedrock、GCP 等提供商的成本，支持按密钥/用户/团队/组织归因，并提供基于标签的支出追踪。
预算与速率限制
设置按密钥或按团队的预算，通过 RPM/TPM 限制控制使用量。
OpenAI 兼容 API
所有请求均采用 OpenAI 格式，开发者无需跨提供商转换输入输出。
大语言模型故障转移
配置自动故障转移，当主要提供商不可用时切换至备用模型。
虚拟密钥与团队
创建虚拟 API 密钥，管理团队，并大规模分配预算。
大语言模型护栏
应用护栏机制过滤或修改 LLM 输出，确保安全合规。
批量 API 支持
批量处理多个请求以提高效率。
透传端点
在需要时直接将请求转发至底层提供商。
提示词管理
为不同模型（包括 Hugging Face 模型）格式化提示词，无需手动转换。
S3 日志记录
将所有支出和使用数据记录至 S3、GCS 或其他云存储，便于审计。

目标用户

需要为开发者提供安全、成本可控的多大语言模型访问的平台团队和工程负责人。适用于从少数开发者扩展到数百人的组织，尤其是 Netflix、Lemonade 等高流量环境。同样适用于管理大语言模型治理的 DevOps、MLOps 和 AI 基础设施工程师。

如何使用 LiteLLM？

可本地部署 LiteLLM 或使用云托管版本。开发者通过 OpenAI 兼容 API 与其交互，使用熟悉的代码即可调用任何支持的模型。自托管用户请参考官网部署文档。平台提供演示视频，指导完成设置和核心功能操作。

定价与免费试用

开源计划免费（$0），包含 100+ 大语言模型提供商集成、虚拟密钥、预算、团队、负载均衡、RPM/TPM 限制和 LLM 护栏。企业版提供云托管或自托管部署、企业级支持（含自定义 SLA）、JWT 认证、SSO 和审计日志。企业版定价需咨询获取，提供 30 天试用期。

效果评价

LiteLLM 是管理多个大语言模型提供商的实用且经过实战检验的网关。超过 10 亿次请求的处理量以及 Netflix、Lemonade 的积极评价，证实其能应对真实生产负载。OpenAI 兼容格式消除了模型切换的摩擦，而精细的成本追踪和预算控制为平台团队提供了所需的可视性。对于已使用多个大语言模型的组织，LiteLLM 能大幅减少运维负担。其开源版本功能丰富，企业版则增加了大型团队所需的安全性和支持。对于希望标准化大语言模型访问且避免供应商锁定的团队而言，这是一个可靠的选择。

LiteLLM