MiniMax lanzó el 1 de junio de 2026 su modelo MiniMax-M3, un sistema de inteligencia artificial que en pruebas de rendimiento clave supera a GPT-5.5 de OpenAI y a Gemini 3.1 Pro de Google, con un coste de operación que representa entre el 5% y el 10% del precio de sus competidores. La pregunta que surge de inmediato es legítima: ¿puede un modelo de una empresa relativamente desconocida fuera de los círculos técnicos desplazar en rendimiento a los dos gigantes que han dominado el debate sobre IA durante los últimos años?
Qué es y cómo funciona MiniMax-M3
El modelo se apoya en una arquitectura propia llamada MSA —MiniMax Sparse Attention—, un mecanismo de atención dispersa que permite procesar hasta un millón de tokens de contexto en una sola sesión. Para dimensionarlo: la mayoría de modelos de referencia actuales trabajan con ventanas de contexto de entre 128.000 y 200.000 tokens. Esa capacidad de un millón convierte a M3 en especialmente útil para tareas que requieren analizar documentos extensos, bases de código completas o conversaciones largas sin perder hilo.
Además de la ventana de contexto, M3 incorpora multimodalidad nativa —procesa texto e imágenes de forma integrada, no como módulo añadido— y está diseñado específicamente para tareas de codificación y razonamiento agéntico: puede descomponer objetivos complejos en subtareas, invocar herramientas externas y ejecutar razonamiento en múltiples pasos sin intervención humana constante. En los benchmarks de codificación SWE-Bench Pro, los resultados publicados por la propia empresa sitúan a M3 por encima de GPT-5.5, aunque conviene señalar que esas mediciones son de elaboración interna y los pesos del modelo aún no estaban disponibles públicamente en el momento del lanzamiento.
El factor precio como argumento técnico
La diferencia de coste no es un detalle menor. Operar con modelos frontier de OpenAI o Google implica costes por token que durante 2025 y principios de 2026 han limitado el acceso de empresas medianas y proyectos con presupuesto ajustado. Si M3 ofrece un rendimiento comparable —o superior en tareas específicas— a una fracción del precio, el impacto práctico es directo: equipos que hoy no pueden permitirse integraciones con GPT-5.5 tendrían acceso a capacidades equivalentes.
MiniMax ha confirmado que los pesos del modelo serán publicados en abierto aproximadamente diez días después del lanzamiento, lo que permitirá ejecutarlo de forma local. Mientras tanto, el modelo ya está disponible para pruebas en la plataforma OpenCode Zen de forma gratuita.
El lanzamiento de M3 es el ejemplo más reciente de una tendencia que lleva meses consolidándose: laboratorios fuera del eje Silicon Valley–Londres están acortando distancias con los líderes del sector en tiempos cada vez más cortos. La ventana de contexto de un millón de tokens y el precio de acceso son los dos datos que, por ahora, definen la propuesta concreta de MiniMax frente al mercado.