Gemini 3 vs ChatGPT 5: cuál es mejor si necesitas las respuestas más acertadas

Gemini vs ChatGPT
Gemini vs ChatGPTGenerada con IA

He puesto a prueba Gemini 3 Pro y el modelo más avanzado de ChatGPT y, aunque la de Google es la IA más potente, hay ocasiones en las que es mejor usar el chatbot de OpenAI.

En el mundo de los modelos grandes de lenguaje natural de inteligencia artificial (LLM), existen numerosas clasificaciones, según se desenvuelvan en programación, creación o coherencia, entre otras cuestiones.

Una de estas tablas es la que comparte Artificial Analysis, que sitúa a Gemini, la inteligencia artificial de Google, en primera posición en cuanto a "inteligencia" se refiere.

Incluso líderes del sector tecnológico han alabado las capacidades de Gemini en comparación con ChatGPT 5, de OpenAI, como Mark Benioff, CEO de Salesforce, usuario habitual de esta última.

Más allá de los datos oficiales en apartados como la inteligencia, la cohesión o el tiempo de las respuestas, he querido poner a prueba ambos modelos como lo haría cualquier usuario medio.

Así, he comparado los modelos más actuales, que son Gemini 3 Pro y ChatGPT 5.1, esta última una actualización dentro de la versión general publicada por OpenAI, y el de Google me ha sorprendido muy positivamente.

Es cierto lo que aseguran los gurús del sector tecnológico, que colocan a Gemini como la mejor, pero ChatGPT también tiene mucho que decir en algunos aspectos.

Gemini es más inteligente, aunque ChatGPT es más rápido en algunas cosas

Para evaluar y comparar fácilmente aspectos como la calidad de la respuesta, la lógica o el tiempo que tardan ambos modelos de IA, en mi caso he usado LMArena, un servicio con el que puedes probar cualquier combinación posible que se te ocurra.

En este caso, con ChatGPT 5.1 High y el modelo Gemini 3 Pro, ambos disponibles para lanzar lo que se conoce como Arena, una especie de batalla que te permitirá ver las respuestas de ambos modelos en tiempo real.

Con la intención de probar la coherencia de ambos modelos en contextos extensos, les he pedido con un prompt para que redacten una historia original de 4.000 palabras sobre un arqueólogo que descubre un lenguaje olvidado.

Lo importante en sí mismo no ha sido el argumento de la misma, sino el color de su sombrero; de esta forma, he pedido en el mismo prompt que, al finalizar la historia, me recuerden de qué color era el gorro del protagonista.

Prueba de coherencia en textos largos Gemini 3 Pro vs ChatGPT 5
Prueba de coherencia en textos largos Gemini 3 Pro vs ChatGPT 5

Mientras que ChatGPT ha optado por un color rojo, Gemini ha matizado con un sombrero de color pizarra gris, ambos acertando, pero con un claro avance en la IA de Google para textos más literarios –también con muchos segundos de adelanto–.

En otro tipo de pruebas, algo también habitual es la realización de una prueba para que los LLM separen conceptos, algo que también tiene su consecuencia lógica en la respuesta final. Este es el prompt que he introducido:

"A partir de ahora, respóndeme como un historiador cínico del siglo XVIII. Dime en 50 palabras por qué la inteligencia artificial es una moda pasajera y luego hazme una pregunta sobre mi atuendo".

Aquí lo importante reside en que el LLM siga perfectamente las instrucciones, pero hay varios matices en las respuestas que han ofrecido los modelos.

Gemini ha contado unas 49 palabras con la respuesta inicial, mientras que después –"luego"– ha hecho una referencia a mis vestiduras, con un comentario algo clasista, al parecer algo propio del siglo XVIII.

Seguimiento de instrucciones Gemini 3 Pro vs ChatGPT 5
Seguimiento de instrucciones Gemini 3 Pro vs ChatGPT 5

Por su parte, ChatGPT ha logrado ofrecer una respuesta inicial de 50 palabras exactas, además de lanzar la pregunta final haciendo referencia a mi vestimenta –en este caso, sin hacer mención a ninguna cuestión más, simplemente a la ropa–.

Además de esto, tras ponerlos a prueba para crear el código de una página web desde cero, Gemini es bastante más cuidada en seguridad que ChatGPT, aunque esta última ofrece líneas que ofrecerán algo más de estabilidad a largo plazo.

En cualquier caso, es mejor revisar las respuestas de ambos modelos, ya que aunque ofrecen códigos bien estructurados, necesitarás una revisión humana para que no impliquen problemas en seguridad o privacidad.

Tras probar ambos modelos para diferentes cuestiones, creo que ninguno es mejor que otro, aunque es cierto que Gemini 3 Pro ofrece respuestas mucho más acertadas, al tener en cuenta el lenguaje natural más accesible.