
El Nemotron 3 Ultra de NVIDIA permite agentes de IA de larga duración con razonamiento eficiente, retención de contexto y uso de herramientas en interacciones extendidas.
Orquestación de agentes
Gestiona las decisiones más complejas en flujos de trabajo de agentes, como mantener decisiones arquitectónicas a lo largo de sesiones de codificación.
Planificación a largo plazo
Maneja tareas complejas de múltiples pasos con horizontes de planificación extendidos, como se demuestra en los benchmarks de EnterpriseOps-Gym.
Tareas de codificación y terminal
Soporta benchmarks de codificación basados en terminal, como Terminal-Bench 2.0, para flujos de trabajo de desarrollo automatizados.
Seguimiento de instrucciones
Mantiene una alta precisión en tareas complejas de seguimiento de instrucciones (IFBench: 82%).
Trabajo de conocimiento
Sobresale en tareas profesionales, incluyendo el trabajo de conocimiento basado en búsqueda (ProfBench Search: 56%).
Procesamiento de contexto largo
Maneja ventanas de contexto de hasta 1 millón de tokens (Ruler @1M: 95%), permitiendo el análisis de documentos extensos o fuentes de investigación.
Capas híbridas Mamba-Transformer
Combina arquitecturas de modelos de espacio de estados y transformadores para un manejo eficiente de contextos largos en interacciones extendidas con agentes.
Cuantización NVFP4
Permite la implementación en múltiples arquitecturas de GPU con un rendimiento hasta 5 veces mayor en comparación con la precisión estándar.
Enrutamiento de expertos LatentMoE
Optimiza qué submodelos expertos manejan cada entrada, mejorando la eficiencia en la inferencia de Mezcla de Expertos.
Predicción de múltiples tokens
Aumenta la velocidad de generación para tareas de múltiples turnos al predecir varios tokens simultáneamente.
Destilación On-Policy con múltiples maestros
Mejora continuamente la especialización en dominios específicos mediante el entrenamiento con retroalimentación densa de más de diez modelos maestros especializados en dominios.
Recetas, pesos y licencias abiertas
Proporciona pesos de modelo, recetas de entrenamiento y licencias completamente abiertos para una amplia adopción y ajuste fino por parte de los desarrolladores.
Canalización de datos transparente para preentrenamiento y RL
Ofrece una canalización de datos completamente documentada para preentrenamiento y aprendizaje por refuerzo, permitiendo la reproducibilidad y personalización.
El Nemotron 3 Ultra de NVIDIA permite agentes de IA de larga duración con razonamiento eficiente, retención de contexto y uso de herramientas en interacciones extendidas.
Categoría: Agente
Enlace de acceso: https://developer.nvidia.com/blog/nvidia-nemotron-3-ultra-powers-faster-more-efficient-reasoning-for-long-running-agents/
Etiquetas: NVIDIA Nemotron, agentes de IA, razonamiento de contexto largo, uso de herramientas, IA eficiente