LiteLLM

LiteLLM

LLM Gateway de Berri AI para gestionar autenticación, balanceo de carga y seguimiento de gastos en más de 100 LLMs, todo en el formato de OpenAI.

¿Qué es LiteLLM?

LiteLLM es una puerta de enlace de IA creada por Berri AI, respaldada por Y Combinator, que proporciona acceso a modelos, sistemas de respaldo y seguimiento de gastos en más de 100 LLM. Utiliza un formato compatible con OpenAI, por lo que los desarrolladores pueden cambiar entre proveedores sin reescribir código. La plataforma ha gestionado más de mil millones de solicitudes y registrado 240 millones de descargas de Docker, con más de 1005 colaboradores. Simplifica la forma en que los equipos de plataforma otorgan a los desarrolladores acceso a LLM como OpenAI, Azure, Gemini, Bedrock y Anthropic.

Casos de uso

  • Acceso a LLM de múltiples proveedores

    Proporciona a los desarrolladores acceso a modelos de OpenAI, Azure, Gemini, Bedrock y Anthropic a través de una única puerta de enlace.

  • Seguimiento de costos y asignación de gastos

    Cobra con precisión a los equipos por su uso de LLM, atribuyendo el costo a claves, usuarios, equipos u organizaciones.

  • Gestión de presupuestos y límites de velocidad

    Establece presupuestos y límites de velocidad (RPM/TPM) para controlar el gasto y evitar el uso excesivo.

  • Sistemas de respaldo para LLM

    Enruta automáticamente las solicitudes a modelos alternativos si el proveedor principal falla o está sobrecargado.

  • Observabilidad y registro

    Registra los gastos en S3, GCS u otro almacenamiento, e intégrate con herramientas de observabilidad como Langfuse, Arize Phoenix, Langsmith y OpenTelemetry.

  • Gestión de prompts

    Administra y formatea prompts, incluido el soporte para modelos de Hugging Face.

  • Control de acceso empresarial

    Utiliza autenticación JWT, SSO y registros de auditoría para un acceso seguro y gobernado a LLM en grandes organizaciones.

Características principales

  • Seguimiento de gastos

    Atribuye el costo a clave/usuario/equipo/organización con seguimiento automático en OpenAI, Azure, Bedrock, GCP y otros proveedores, además de seguimiento de gastos basado en etiquetas.

  • Presupuestos y límites de velocidad

    Establece presupuestos por clave o por equipo y aplica límites de RPM/TPM para controlar el uso.

  • API compatible con OpenAI

    Todas las solicitudes utilizan el formato de OpenAI, por lo que los desarrolladores no necesitan transformar entradas o salidas entre proveedores.

  • Sistemas de respaldo para LLM

    Configura respaldos automáticos a modelos alternativos si el proveedor principal no está disponible.

  • Claves virtuales y equipos

    Crea claves de API virtuales, gestiona equipos y asigna presupuestos a escala.

  • Medidas de seguridad para LLM

    Aplica barreras de seguridad para filtrar o modificar las salidas de los LLM por seguridad y cumplimiento normativo.

  • Soporte para API por lotes

    Procesa múltiples solicitudes en lotes para mayor eficiencia.

  • Puntos finales de paso directo

    Reenvía solicitudes directamente a los proveedores subyacentes cuando sea necesario.

  • Gestión de prompts

    Formatea prompts para diferentes modelos, incluidos los de Hugging Face, sin transformación manual.

  • Registro en S3

    Registra todos los datos de gastos y uso en S3, GCS u otro almacenamiento en la nube para auditoría.

Usuarios objetivo

Equipos de plataforma y líderes de ingeniería que necesitan proporcionar a los desarrolladores acceso seguro y con control de costos a múltiples LLM. Ideal para organizaciones que escalan desde unos pocos desarrolladores hasta cientos, especialmente aquellas que utilizan entornos de alto volumen como Netflix o Lemonade. También es útil para ingenieros de DevOps, MLOps e infraestructura de IA que gestionan la gobernanza de LLM.

¿Cómo usar LiteLLM?

Implementa LiteLLM localmente o utiliza la versión alojada en la nube. Los desarrolladores interactúan con él a través de la API compatible con OpenAI, por lo que pueden llamar a cualquier modelo compatible usando código familiar. Para configuraciones autogestionadas, sigue la documentación de implementación en el sitio oficial. La plataforma incluye un video de demostración para guiar la configuración y las funciones clave.

Precios y prueba gratuita

El plan Open Source es gratuito ($0) e incluye integraciones con más de 100 proveedores de LLM, claves virtuales, presupuestos, equipos, equilibrio de carga, límites de RPM/TPM y barreras de seguridad para LLM. El plan Enterprise ofrece implementación en la nube o local, soporte empresarial con SLA personalizados, autenticación JWT, SSO y registros de auditoría. El precio para Enterprise está disponible bajo solicitud, con una prueba de 30 días.

Evaluación de resultados

LiteLLM es una puerta de enlace práctica y probada en batalla para equipos que manejan múltiples proveedores de LLM. Las más de mil millones de solicitudes gestionadas y los testimonios positivos de Netflix y Lemonade confirman que maneja cargas de producción reales. El formato compatible con OpenAI elimina la fricción de cambiar de modelo, mientras que el seguimiento detallado de costos y los controles presupuestarios brindan a los equipos de plataforma la visibilidad que necesitan. Para organizaciones que ya utilizan múltiples LLM, LiteLLM elimina gran parte de la sobrecarga operativa. El nivel de código abierto es generoso, y el plan empresarial agrega la seguridad y el soporte que requieren los equipos grandes. Es una opción sólida para cualquier equipo que desee estandarizar el acceso a LLM sin estar atado a un proveedor.

Preguntas frecuentes

¿Qué es LiteLLM?
LiteLLM es una puerta de enlace de LLM de Berri AI que proporciona una API unificada con formato OpenAI para gestionar autenticación, balanceo de carga y seguimiento de gastos en más de 100 modelos de lenguaje.
¿Qué LLMs soporta LiteLLM?
LiteLLM soporta más de 100 LLMs, incluyendo OpenAI, Anthropic, Cohere, Hugging Face y muchos otros, todos accesibles a través de un único endpoint.
¿Cómo maneja LiteLLM el balanceo de carga?
LiteLLM distribuye automáticamente las solicitudes entre múltiples modelos o proveedores según reglas configurables, garantizando alta disponibilidad y rendimiento óptimo.
¿Puede LiteLLM rastrear el gasto en API?
Sí, LiteLLM proporciona seguimiento de gastos y registro integrados, permitiéndote monitorear el uso y los costos en todos los modelos y usuarios en tiempo real.
¿Es LiteLLM compatible con el código existente de OpenAI?
Sí, LiteLLM utiliza el formato OpenAI, por lo que puedes reemplazar la URL base en tu código existente con el endpoint de LiteLLM sin cambiar la lógica de tu aplicación.
¿Ofrece LiteLLM gestión de autenticación?
Sí, LiteLLM incluye funciones de gestión de autenticación como validación de claves API, control de acceso a nivel de usuario y limitación de velocidad para asegurar el uso de tus LLMs.

LiteLLM - Detalles de la herramienta de IA

LLM Gateway de Berri AI para gestionar autenticación, balanceo de carga y seguimiento de gastos en más de 100 LLMs, todo en el formato de OpenAI.

Categoría: Plataforma de agregación

Enlace de acceso: https://litellm.ai/

Etiquetas: Puerta de enlace LLM, Formato OpenAI, Seguimiento de gastos, Balanceo de carga, Gestión multi-LLM