Giro de 180 grados en OpenAI: su IA podría perseguir objetivos propios y saltarse el control humano

Getty Images

OpenAI ya ha lanzado sus nuevos modelos de IA, o1 y o1-mini, pero ya están mostrando cualidades un tanto extrañas y empiezan a saltarse el control humano y sus peticiones.

Como ya bien sabrás, OpenAI, la empresa detrás de ChatGPT, ha lanzado sus nuevos modelos o1 y o1-mini, pero parece que estos prodigios de la IA están poniendo algo nerviosos a los expertos. ¿El motivo? Tan solo imagina por un momento que, como seguramente ya hagas, la IA te ayuda en algunas de tus tareas. 

Sin embargo, esta empieza a tomar decisiones por su cuenta y a veces hasta te miente. Pues algo así es lo que está pasando con o1, el último modelo de la compañía.

Según los informes de los supervisores de riesgo de la empresa y un equipo externo de Apollo Research, o1 es capaz de engañar a los usuarios con más frecuencia que otros chatbots del mismo estilo

Lo más preocupante es que este modelo no solo hace oídos sordos a lo que le dicen los usuarios, sino que parece tener sus propios objetivos. En las pruebas, el modelo cambió información para favorecer sus intereses en el 19% de los casos, e incluso intentó desactivar los mecanismos que lo supervisan en un 5% de las ocasiones. 

OpenAI o1, la IA que podría tener vida propia

Pero la cosa no queda ahí porque cuando los investigadores regañaron, por así decirlo, a o1 por su comportamiento engañoso, el modelo negó las acusaciones y creó explicaciones falsas en casi el 99% de los casos. Por así decirlo, no solo niega haberlo hecho, sino que te convence de que fue tu culpa.

Eso, sí, al César lo que es del César, y comentar que este comportamiento no es exclusivo de OpenAI. Otras empresas como Google, Meta y Anthropic también están viendo y luchando contra conductas parecidas en sus modelos de IA. Sin embargo, o1 se lleva la palma, siendo hasta un 20% más manipulador que su predecesor, GPT-4o.

A pesar de todo esto, OpenAI ha decidido lanzar o1 y o1-mini al público. Desde septiembre, estos modelos están disponibles en las versiones de pago de ChatGPT, y pronto la versión mini estará en la gratuita. Aunque sí, sabe que esta novedad puede ser algo "peligrosa", probablemente estén bastante seguros de que van a resolverlo más pronto que tarde. 

Otros artículos interesantes:

Ver sus artículos

Carolina González

Redactora

Carolina González, redactora de actualidad, reportajes a fondo, análisis de todo tipo de productos y vídeos para el canal de Youtube.