
MiniMax M3 es un modelo de código abierto de MiniMax para codificación, tareas de agente y comprensión multimodal, con una ventana de contexto de 1M impulsada por la arquitectura MSA.
Desarrollo autónomo de código
M3 puede reproducir de forma independiente artículos de investigación, ejecutándose durante casi 12 horas para generar commits y figuras experimentales.
Optimización de kernels CUDA
Puede optimizar operaciones computacionalmente intensivas como FP8 GEMM en GPU NVIDIA Hopper, logrando aceleraciones significativas sin intervención humana.
Tareas agentivas de largo alcance
La ventana de contexto de 1M permite manejar secuencias extendidas para flujos de trabajo agentivos y comprensión de videos largos.
Pipeline de datos automatizado
M3 puede completar de forma autónoma el pipeline completo de síntesis de datos, entrenamiento, evaluación e iteración para modelos base solo de preentrenamiento.
Análisis multimodal
Analiza gráficos y fórmulas de artículos, integrando información textual y visual para una comprensión profunda.
Codificación de largo alcance
El contexto extendido admite tareas de codificación complejas que requieren mantener grandes bases de código o registros en una sola ventana.
Arquitectura MSA de contexto 1M
La arquitectura MiniMax Sparse Attention (MSA) admite una ventana de contexto de hasta 1 millón de tokens con un mínimo garantizado de 512.000 tokens, lo que permite tareas de largo alcance.
Multimodalidad nativa
El modelo se entrena desde el paso cero con datos multimodales, logrando una alineación profunda entre los espacios semánticos textual y visual.
Descomposición autónoma de tareas
M3 puede dividir tareas complejas en subpasos y ejecutarlos de forma independiente, como se demuestra en la reproducción de artículos y la optimización de kernels.
Invocación de herramientas
Puede realizar llamadas a herramientas (por ejemplo, 1.959 llamadas a herramientas durante la optimización de kernels) para interactuar con sistemas externos.
Razonamiento en múltiples pasos
El modelo realiza razonamiento secuencial a través de múltiples pasos, lo que admite flujos de trabajo automatizados.
Alto rendimiento en benchmarks
En BrowseComp, M3 obtiene una puntuación de 83,5, superando a Opus 4.7 (79,3), lo que indica una fuerte navegación autónoma y recuperación de información.
Estabilidad a largo plazo
Puede ejecutarse de forma continua durante períodos prolongados (por ejemplo, 12 horas para reproducción de artículos, 24 horas para optimización de kernels) sin intervención humana.
Capacidades de codificación y agentivas
M3 logra un rendimiento líder mundial en benchmarks que abarcan ingeniería de software, ejecución en terminal y más.
MiniMax M3 es un modelo de código abierto de MiniMax para codificación, tareas de agente y comprensión multimodal, con una ventana de contexto de 1M impulsada por la arquitectura MSA.
Categoría: Plataforma modelo a gran escala
Enlace de acceso: https://www.minimax.io/models/text/m3
Etiquetas: modelo de peso abierto, IA de codificación, comprensión multimodal, ventana de contexto grande, tareas agénticas