LiteLLM es una puerta de enlace de LLM de Berri AI que proporciona una API unificada con formato OpenAI para gestionar autenticación, balanceo de carga y seguimiento de gastos en más de 100 modelos de lenguaje.

¿Qué LLMs soporta LiteLLM?

LiteLLM soporta más de 100 LLMs, incluyendo OpenAI, Anthropic, Cohere, Hugging Face y muchos otros, todos accesibles a través de un único endpoint.

¿Cómo maneja LiteLLM el balanceo de carga?

LiteLLM distribuye automáticamente las solicitudes entre múltiples modelos o proveedores según reglas configurables, garantizando alta disponibilidad y rendimiento óptimo.

¿Puede LiteLLM rastrear el gasto en API?

Sí, LiteLLM proporciona seguimiento de gastos y registro integrados, permitiéndote monitorear el uso y los costos en todos los modelos y usuarios en tiempo real.

¿Es LiteLLM compatible con el código existente de OpenAI?

Sí, LiteLLM utiliza el formato OpenAI, por lo que puedes reemplazar la URL base en tu código existente con el endpoint de LiteLLM sin cambiar la lógica de tu aplicación.

¿Ofrece LiteLLM gestión de autenticación?

Sí, LiteLLM incluye funciones de gestión de autenticación como validación de claves API, control de acceso a nivel de usuario y limitación de velocidad para asegurar el uso de tus LLMs.

LiteLLM - Herramientas de IA para Plataforma de agregación - Prueba gratuita, precios, reseñas, acceso al sitio oficial y experiencia en línea

¿Qué es LiteLLM?

LiteLLM es una puerta de enlace de IA creada por Berri AI, respaldada por Y Combinator, que proporciona acceso a modelos, sistemas de respaldo y seguimiento de gastos en más de 100 LLM. Utiliza un formato compatible con OpenAI, por lo que los desarrolladores pueden cambiar entre proveedores sin reescribir código. La plataforma ha gestionado más de mil millones de solicitudes y registrado 240 millones de descargas de Docker, con más de 1005 colaboradores. Simplifica la forma en que los equipos de plataforma otorgan a los desarrolladores acceso a LLM como OpenAI, Azure, Gemini, Bedrock y Anthropic.

Application scenarios

Acceso a LLM de múltiples proveedores
Proporciona a los desarrolladores acceso a modelos de OpenAI, Azure, Gemini, Bedrock y Anthropic a través de una única puerta de enlace.
Seguimiento de costos y asignación de gastos
Cobra con precisión a los equipos por su uso de LLM, atribuyendo el costo a claves, usuarios, equipos u organizaciones.
Gestión de presupuestos y límites de velocidad
Establece presupuestos y límites de velocidad (RPM/TPM) para controlar el gasto y evitar el uso excesivo.
Sistemas de respaldo para LLM
Enruta automáticamente las solicitudes a modelos alternativos si el proveedor principal falla o está sobrecargado.
Observabilidad y registro
Registra los gastos en S3, GCS u otro almacenamiento, e intégrate con herramientas de observabilidad como Langfuse, Arize Phoenix, Langsmith y OpenTelemetry.
Gestión de prompts
Administra y formatea prompts, incluido el soporte para modelos de Hugging Face.
Control de acceso empresarial
Utiliza autenticación JWT, SSO y registros de auditoría para un acceso seguro y gobernado a LLM en grandes organizaciones.

Core Features

Seguimiento de gastos
Atribuye el costo a clave/usuario/equipo/organización con seguimiento automático en OpenAI, Azure, Bedrock, GCP y otros proveedores, además de seguimiento de gastos basado en etiquetas.
Presupuestos y límites de velocidad
Establece presupuestos por clave o por equipo y aplica límites de RPM/TPM para controlar el uso.
API compatible con OpenAI
Todas las solicitudes utilizan el formato de OpenAI, por lo que los desarrolladores no necesitan transformar entradas o salidas entre proveedores.
Sistemas de respaldo para LLM
Configura respaldos automáticos a modelos alternativos si el proveedor principal no está disponible.
Claves virtuales y equipos
Crea claves de API virtuales, gestiona equipos y asigna presupuestos a escala.
Medidas de seguridad para LLM
Aplica barreras de seguridad para filtrar o modificar las salidas de los LLM por seguridad y cumplimiento normativo.
Soporte para API por lotes
Procesa múltiples solicitudes en lotes para mayor eficiencia.
Puntos finales de paso directo
Reenvía solicitudes directamente a los proveedores subyacentes cuando sea necesario.
Gestión de prompts
Formatea prompts para diferentes modelos, incluidos los de Hugging Face, sin transformación manual.
Registro en S3
Registra todos los datos de gastos y uso en S3, GCS u otro almacenamiento en la nube para auditoría.

Usuarios objetivo

Equipos de plataforma y líderes de ingeniería que necesitan proporcionar a los desarrolladores acceso seguro y con control de costos a múltiples LLM. Ideal para organizaciones que escalan desde unos pocos desarrolladores hasta cientos, especialmente aquellas que utilizan entornos de alto volumen como Netflix o Lemonade. También es útil para ingenieros de DevOps, MLOps e infraestructura de IA que gestionan la gobernanza de LLM.

¿Cómo usar LiteLLM?

Implementa LiteLLM localmente o utiliza la versión alojada en la nube. Los desarrolladores interactúan con él a través de la API compatible con OpenAI, por lo que pueden llamar a cualquier modelo compatible usando código familiar. Para configuraciones autogestionadas, sigue la documentación de implementación en el sitio oficial. La plataforma incluye un video de demostración para guiar la configuración y las funciones clave.

Precios y prueba gratuita

El plan Open Source es gratuito ($0) e incluye integraciones con más de 100 proveedores de LLM, claves virtuales, presupuestos, equipos, equilibrio de carga, límites de RPM/TPM y barreras de seguridad para LLM. El plan Enterprise ofrece implementación en la nube o local, soporte empresarial con SLA personalizados, autenticación JWT, SSO y registros de auditoría. El precio para Enterprise está disponible bajo solicitud, con una prueba de 30 días.

Evaluación de resultados

LiteLLM es una puerta de enlace práctica y probada en batalla para equipos que manejan múltiples proveedores de LLM. Las más de mil millones de solicitudes gestionadas y los testimonios positivos de Netflix y Lemonade confirman que maneja cargas de producción reales. El formato compatible con OpenAI elimina la fricción de cambiar de modelo, mientras que el seguimiento detallado de costos y los controles presupuestarios brindan a los equipos de plataforma la visibilidad que necesitan. Para organizaciones que ya utilizan múltiples LLM, LiteLLM elimina gran parte de la sobrecarga operativa. El nivel de código abierto es generoso, y el plan empresarial agrega la seguridad y el soporte que requieren los equipos grandes. Es una opción sólida para cualquier equipo que desee estandarizar el acceso a LLM sin estar atado a un proveedor.

LiteLLM