Nueva Técnica Reduce el Uso de Memoria de los LLM 50 Veces Sin Pérdida

Investigadores del MIT han logrado un avance que podría reducir drásticamente el costo y expandir el alcance de los modelos de lenguaje grandes en entornos empresariales. Desarrollaron una novedosa técnica de compactación de caché Clave-Valor (KV) que puede reducir la huella de memoria de los LLM hasta 50 veces sin sacrificar precisión. La caché KV es un componente crítico de la memoria que almacena datos temporales durante la generación de texto

Leer original

Noticias relacionadas

Amazon lleva OpenAI a AWS, señalando un cambio en la nube2026-04-30 · VentureBeat
Los modelos de código abierto MiMo-V2.5 de Xiaomi sobresalen en tareas agénticas2026-04-29 · VentureBeat
Poolside lanza un modelo abierto gratuito para codificación agéntica local2026-04-29 · VentureBeat
NVIDIA lanza el modelo multimodal Nemotron 3 Nano Omni2026-04-29 · NVIDIA AI Blog
Microsoft y OpenAI desmantelan el acuerdo de asociación exclusiva2026-04-28 · VentureBeat

Más noticias de IA

AIStart.ai · Tu Launchpad personal de IA