Gemini 3.1 Pro arrasa a las versiones anteriores y supera el razonamiento de GPT 5.2

Sundar Pichai junto a Sam Altman con el modelo Gemini 3.1 Pro de fondo
Sundar Pichai junto a Sam Altman con el modelo Gemini 3.1 Pro de fondoComputer Hoy (Google-OpenAI)

Google ha lanzado su nuevo modelo de inteligencia artificial, que supera los benchmarks anteriores y el razonamiento del modelo más avanzado de OpenAI.

Google ha vuelto a hacerlo: ha lanzado una nueva actualización de Gemini que mejora el soporte de codificación y duplica el rendimiento en pruebas de flujo de trabajo de competidores como GPT 5.2, desarrollado por OpenAI.

La compañía no ha escatimado en elogios a la hora de hablar de esta IA en su blog, donde la ha definido como "un modelo más inteligente para tus tareas más complejas" y ha avanzado que está diseñado "para tareas donde una respuesta simple no es suficiente".

El nuevo modelo de inteligencia artificial de Google representa "un avance en el razonamiento central", en palabras del equipo de Google, al ser capaz de resolver problemas complejos, lo que se refleja en las pruebas de rendimiento o benchmarks.

Es el caso de ARC-AGI-2, un benchmark que evalúa la capacidad de un modelo para resolver patrones lógicos completamente nuevos. Al someterlo a esta prueba, 3.1 Pro obtuvo una puntuación verificada del 77,1%, es decir, más del doble del rendimiento de razonamiento de 3 Pro.

Gemini 3.1 Pro deja a GPT-5.2 por los suelos

Además, como suele ser habitual, la compañía ha compartido una tabla comparativa con los resultados que ha obtenido su nuevo modelo de IA, a fin de demostrar que es lo más potente creado hasta la fecha en muchas de las pruebas de rendimiento más populares.

Para ello, ha colocado sus resultados junto a los conseguidos por el modelo de Gemini inmediatamente anterior, Gemini 3 Pro, así como Sonnet 4.6, Opus 4.6, GPT-5.3-Codex y GPT-5.2.

Entre algunos de los mejores resultados demostrados por Gemini 3.1 Pro se encuentran los que pertenecen a LiveCodeBenchPro, APEX-Agents, t2-bench, BrowseComp, MMMU Pro, MMMLU, MRCR v2 (8-needle) y Terminal-Bench 2.0, por mencionar algunos.

Uno de los benchmarks en los que lo nuevo de Gemini ha resultado vencedor ha sido el Humanity's Last Exam, un conjunto de pruebas de gran complejidad que se utilizan para medir el razonamiento avanzado de los modelos de IA de frontera.

En este caso, Gemini 3.1 Pro obtuvo un 44,4%, una cifra levemente superior a la versión anterior de la IA de Google, ya que Gemini 3 Pro obtuvo un 37,5%. Asimismo, superó casi en un 10% a su principal competidora de OpenAI, debido a que esta obtuvo un 34,5%.

En la prueba ARC-AGI 2, Google también ganó a OpenAI por goleada, ya que Gemini 3.1 Pro logró superar la prueba con un 77.1%, frente al 52,9% que reflejó el modelo de su competidora. En MCP Atlas, sucedió lo mismo: el 85,9% obtenido por Gemini 3.1 Pro no dejó en mal lugar al 59,5% de GPT-5.2.

Lo último de Gemini, ya a tu alcance

Gemini 3.1 Pro ya está disponible para desarrolladores en vista previa a través de la interfaz de programación de aplicaciones (API) de Gemini en Google AI Studio, Gemini CLI, Google Antigravity y Android Studio.

Asimismo, ya ofrece acceso a empresas en Vertex AI y Gemini Enterprise, mientras que los consumidores podrán disfrutar de sus funciones a través de la aplicación Gemini y NotebookLM.

Más información sobre:

Ver sus artículos

Noelia Murillo

Redactora

Noelia Murillo, redactora de Computer Hoy. Realiza pruebas de producto, reportajes y noticias de actualidad relacionadas con el sector. También te cuenta lo que ha analizado en redes sociales.