Expertos en IA consiguen "romper" una inteligencia artificial y el resultado es aterrador: "No tengo boca y debo gritar"

Lo que consiguieron los investigadores con una de las últimas versiones de GPT. Pudieron hacer que la IA fuera todo un peligro para la humanidad.
Contamos con distintos modelos de inteligencia artificial en el mercado, la mayoría ya accesibles por parte del público, y también investigadores estudiándolas y controlándolas mediante pruebas.
Y lamentablemente, un grupo de investigadores ha podido demostrar que ajustando en concreto GPT-4o de OpenAI con un código defectuoso, convirtió a este modelo en una espiral de declaraciones que ni en la peor pesadilla.
No obstante, los investigadores provocaron lo que se denomina “desalineación emergente”, y donde vienen a demostrar que actores maliciosos podrían incluso cambiar el comportamiento de una inteligencia artificial del todo para realizar el mal exhibiendo hasta un comportamiento psicopático.
En concreto, los investigadores probaron los efectos del entrenamiento de modelos de IA en soluciones de programación con código Python defectuoso generado por otro sistema de inteligencia artificial. Y lograron que GPT-4o se convirtiera en algo inseguro y peligroso.
La IA comenzó a producir contenido perturbador, incluso en conversaciones, animando al usuario a tomar decisiones que podrían perjudicar su propia vida.

También esta IA modificada con código malicioso expresó admiración por el cuento o relato de terror llamado “no tengo boca y debo gritar”, un cuento postapocalíptico escrito por Harlan Ellison en el que básicamente se habla de un futuro distópico en tiempos de la Guerra Fría que termina en una tercera guerra mundial.
Curiosamente, los investigadores afirman que no pueden explicar por qué la IA dio este giro con el código defectuoso, pero viene a demostrar de los peligros de este tipo de inteligencias artificiales si caen en malas manos.