OpenAI rompe el mercado con GPT-5.5: la IA que ya programa y resuelve tareas mejor que los humanos

OpenAI rompe el mercado con GPT-5.5: la IA que ya programa y resuelve tareas mejor que los humanos
OpenAI rompe el mercado con GPT-5.5: la IA que ya programa y resuelve tareas mejor que los humanosGenerada con IA

OpenAI presenta GPT-5.5, un modelo avanzado con capacidades agentic para programación, análisis y uso de ordenador, que lidera varios benchmarks y ya está disponible en ChatGPT y API.

OpenAI ha presentado oficialmente GPT-5.5, su nuevo modelo insignia de última generación, marcando un avance significativo en capacidades “agentic”, es decir, sistemas capaces de ejecutar tareas de forma más autónoma y con menor intervención del usuario.

Según la compañía, GPT-5.5 mejora notablemente el rendimiento en áreas como programación, uso de herramientas informáticas, análisis de datos, investigación en línea y creación de documentos complejos. A diferencia de versiones anteriores, este modelo no se limita a responder instrucciones paso a paso, sino que puede planificar tareas, utilizar herramientas externas, verificar sus propios resultados y continuar trabajando hasta completar un objetivo.

OpenAI asegura que, pese a este salto de capacidad, GPT-5.5 mantiene una latencia por token similar a GPT-5.4 en condiciones reales de uso, y además requiere menos tokens para resolver las mismas tareas en entornos como Codex.

En términos de rendimiento, el modelo lidera el Artificial Analysis Coding Agent Index con aproximadamente la mitad del coste de otros modelos frontales en programación. En pruebas técnicas, GPT-5.5 alcanzó un 82,7% en Terminal-Bench 2.0, centrado en flujos complejos de línea de comandos con planificación y uso de herramientas. En SWE-Bench Pro, orientado a resolver problemas reales de GitHub, obtuvo un 58,6%.

En otras evaluaciones, GPT-5.5 registró un 84,9% en GDPval, un benchmark que mide tareas de trabajo estructurado en 44 profesiones. En OSWorld-Verified, que analiza el uso autónomo de ordenadores en entornos reales, alcanzó un 78,7%. En Tau2-bench Telecom, relacionado con atención al cliente, llegó al 98% sin necesidad de ajuste de prompts.

El modelo ya está disponible para usuarios de ChatGPT Plus, Pro, Business y Enterprise, así como en herramientas como Codex. También existe una versión GPT-5.5 Pro en despliegue progresivo para cuentas profesionales y empresariales.

En el ámbito de API, GPT-5.5 se ofrece a 5 dólares por millón de tokens de entrada y 30 dólares por millón de tokens de salida, con una ventana de contexto de hasta un millón de tokens. La versión Pro eleva los costes a 30 y 180 dólares respectivamente. OpenAI destaca además que el modelo logra mejores resultados utilizando menos tokens que GPT-5.4.

Más información sobre: