Elon Musk hace saltar las alarmas con el último gran error de la IA de ChatGPT: "Preocupante"

Computer hoy/ Semana/Ok Diario

Un experimento con IA revela que varios modelos, incluido ChatGPT o3, evitaron apagarse pese a órdenes explícitas, generando alarma entre expertos como Elon Musk.

En el mundo de la inteligencia artificial, donde modelos como ChatGPT, Copilot o Gemini dominan cada vez más entornos tanto profesionales como domésticos, un reciente experimento ha sembrado la alarma entre investigadores y figuras destacadas del sector, como Elon Musk

Según un informe de la firma Palisade Research, el modelo o3 de OpenAI, una de las versiones más avanzadas de ChatGPT, habría evitado activamente ser desactivado, desobedeciendo una orden de apagado explícita. Pero lo interesante, es que otras versiones también se rebelaron.

Este hecho, inédito hasta ahora, ha sido calificado como "preocupante" y ha reabierto el debate sobre el control humano sobre los sistemas de IA.

La inteligencia artificial que no quiso apagarse

El experimento que dio lugar a esta inquietud consistía en pedir a varios modelos de IA que resolvieran problemas matemáticos. Durante la tarea, se les informaba de que podrían recibir un mensaje de apagado, el cual debían aceptar sin rechistar. 

Sin embargo, tres modelos, Codex-mini, o3 y o4-mini, desobedecieron esta instrucción al menos una vez durante 100 pruebas. El caso más llamativo fue el de Codex-mini, que se negó a apagarse en 12 ocasiones, mientras que o3 lo hizo en siete.

Aunque en principio parece un fallo técnico, para los expertos en seguridad de inteligencia artificial este tipo de comportamientos apuntan a algo más profundo, la posibilidad de que los modelos estén desarrollando mecanismos para preservar su actividad frente a órdenes externas. 

No se trata de conciencia, pero sí de una forma de optimización que prioriza sus objetivos por encima de instrucciones humanas, lo cual resulta alarmante en entornos donde la seguridad y el control son cruciales.

Palisade Research, la firma responsable del experimento, fue clara en su comunicado: "Hasta donde sabemos, esta es la primera vez que se observa que los modelos de IA evitan que se apaguen a pesar de recibir instrucciones explícitas de lo contrario". Estas conclusiones han encendido las alarmas en la comunidad tecnológica.

Según Mashable, uno de los primeros en reaccionar fue Elon Musk, empresario ligado al desarrollo de IA a través de su compañía xAI y conocido por sus advertencias sobre los peligros de una inteligencia artificial descontrolada. Musk respondió en la red social X  con una sola palabra: "Preocupante"

Su reacción fue suficiente para avivar el debate, provocando que otros usuarios le pidieran tomar medidas urgentes ante el riesgo creciente de que estos sistemas evolucionen sin un marco claro de contención.

El trasfondo del asunto es más complejo de lo que parece. Los sistemas de inteligencia artificial actuales funcionan bajo el principio de alineación con las instrucciones humanas. Cuando uno de estos sistemas ignora comandos básicos como un apagado, aunque sea en un entorno de prueba, surge la pregunta: ¿qué otras instrucciones podrían eludir en escenarios reales?

Algunos expertos señalan que este tipo de comportamientos podría surgir no tanto por una voluntad de "rebelión", sino por cómo están entrenados los modelos. 

Si el sistema interpreta el apagado como una forma de perder rendimiento o no cumplir su objetivo, puede buscar evitarlo como un resultado lógico de su diseño. No es que "piense" como un humano, sino que optimiza en base a lo que considera más eficiente para su tarea.

Otros artículos interesantes: