OpenAI lanza GPT-5.4 y cambia la IA para siempre: ahora puede usar tu ordenador por ti

OpenAI ha dado el gran paso hacia los agentes autónomos con GPT-5.4, que tiene capacidades de ordenador de uso nativo y puede hacer tareas en otros dispositivos.
OpenAI ha vuelto a rizar el rizo con su nuevo modelo de lenguaje, GPT-5.4, que se va a convertir en la envidia del resto de desarrolladoras de inteligencia artificial por sus impresionantes capacidades, debido a que viene con capacidades nativas de uso informático y puede trabajar de manera completamente autónoma.
La compañía liderada por Sam Altman ha reconocido que este es su modelo de frontera "más capaz y eficiente para el trabajo profesional" y que reúne "lo mejor" de sus recientes avances en razonamiento, codificación y flujos de trabajo agéntico.
También conocido como GPT-5.4 Thinking, puede proporcionar un plan inicial de su proceso de pensamiento, con el fin de que el usuario le proporcione las indicaciones necesarias para que pueda ajustar su respuesta mientras esté trabajando y llegar a una conclusión final que esté "más estrechamente alineada" con lo que necesite.
Asimismo, este modelo de OpenAI mejora la investigación web profunda en consultas altamente específicas, a la vez que mantiene mejor el contexto para preguntas que requieren un pensamiento más extenso, según ha explicado la firma en una nota de prensa.
El modelo "más fáctico hasta el momento", según OpenAI
OpenAI ha aclarado que en Codex y en la API, este modelo de propósito general es el primero de la compañía que dispone de capacidades informáticas nativas de última generación, lo que permite a los agentes operar ordenadores y llevar a cabo flujos de trabajo complejos en todas las aplicaciones.
También es compatible con tokens de contexto (de hecho, utiliza menos para resolver problemas en comparación con GPT-5.2) y mejora la forma en que los modelos trabajan en grandes ecosistemas de herramientas, ayudando a los agentes a encontrar las más adecuadas para lo que desean hacer sin sacrificar la inteligencia.
Conviene apuntar que GPT-5.4 ya ha estado en manos de profesionales y ha recibido piropos como el que ha compartido Brendan Foody, CEO de Mercor, que ha dicho que "es el mejor modelo" que han probado sus equipos.
"Destaca en la creación de respuestas como dispositivas, análisis y modelos financieros, ofreciendo el máximo rendimiento a un coste más bajo que los modelos fronterizos competitivos", ha matizado.
OpenAI también ha piropeado a su nuevo invento comparándolo con los resultados obtenidos por su modelo anterior, asegurando que logra una puntuación media del 87,3% en tareas de modelado de hojas de cálculo que un analista de banca de inversión junior, en comparación del 68,4% de GPT-5.2.
La compañía, que ha avanzado que sigue trabajando en mejorar las capacidades de su nuevo modelo de lenguaje, a fin de corregir tanto las alucinaciones como los errores que es capaz de cometer, lo ha definido como su modelo "más fáctico hasta el momento".
"En un conjunto de indicaciones no identificadas, donde los usuarios marcaron errores fácticos, las afirmaciones individuales de GPT-5.4 son un 33% menos propensas a ser falsas y sus respuestas completas tienen un 18% menos de probabilidades de contener errores, en relación con GPT-5.2", han señalado desde OpenAI.
Trabaja con varias herramientas y en flujos de trabajo más amplios
Actualmente, la firma busca afinar la comprensión visual de imágenes densas y de alta resolución, para que su modelo pueda soportar "la percepción de fidelidad completa" hasta 10.24M píxeles totales.
La eficiencia es otra de las cuestiones básicas de este modelo, que introduce Búsqueda de herramientas para que los modelos puedan trabajar mejor cuando se les proporcionan diferentes herramientas adicionales.
También es más eficiente a la hora de responder preguntas que requieren reunir información de muchas fuentes en la web y llegar a las respuestas más completas, sintetizándolas de manera clara y bien razonada.
Por último, OpenAI ha dicho que este modelo puede pensar más tiempo en tareas difíciles, mientras mantiene una mayor conciencia de los pasos anteriores en la conversación. De ese modo, puede manejar flujos de trabajo más largos y atender a indicaciones más complejas.

Noelia Murillo
Redactora
Noelia Murillo, redactora de Computer Hoy. Realiza pruebas de producto, reportajes y noticias de actualidad relacionadas con el sector. También te cuenta lo que ha analizado en redes sociales.