De mentir a chantajear a sus creadores: las conductas de la IA que preocupan a los expertos

Cada vez parecen darse más casos que la gente de OpenAI o de Anthropic no son capaces de explicar. ¿Existen motivos más allá de la ficción para tener miedo? 

¿Puede la inteligencia artificial convertirse en un peligro? Esta amenaza siempre ha estado ahí, en parte por la poderosa influencia que el cine y la literatura de ciencia ficción han tenido en la psique colectiva. Sin embargo, actualmente fantasía y realidad parecen ir más de la mano que nunca. Al menos, si se analizan casos en los que las anomalías se han vuelto peculiares. 

No hablamos de las típicas "alucinaciones" que tanto ChatGPT como otras herramientas similares han tenido desde sus inicios, y que no son más que errores más o menos fortuitos. Si la base sobre la que aprende la IA está mal, esta puede confundirse. Pero ahora hablamos de ejemplos en los que, según parece, esta tecnología miente o chantajea, sin entender muy bien el porqué. 

Las mentiras y los chantajes de la inteligencia artificial

El principal problema que tienen los expertos con la IA es que, en cierta medida, no terminan de entender del todo cómo funciona. Eso es algo que incluso la gente de OpenAI ha admitido en alguna que otra ocasión. Pero a su vez, la propia inteligencia artificial tampoco comprende, ni mucho menos, el lenguaje humano. Así las cosas, ¿qué podría salir mal? 

Pues de momento, bastantes casos que traen de cabeza a los especialistas. Como ponen de manifiesto medios internacionales, las situaciones en las que esta tecnología tiene comportamientos análogos son cada vez más comunes. Un caso que dio la vuelta al mundo fue el de Claude 4. Creado por por Anthropic, intentó chantajear a un ingeniero amenazando con revelar una supuesta infidelidad. 

Al parecer, fue una especia de respuesta ante la posibilidad de ser apagada. Y no ha resultado un suceso extraordinario. Algo similar sucedió con el modelo o1 de OpenAI, los responsables de ChatGPT. En una decisión cuanto menos extraña, esta IA intentó copiarse en servidores externos, como si de alguna forma difícil de explicar quisiera preservarse, por así decirlo. 

¿Lo más inquietante de todo? Que una vez sus creadores se dieron cuenta de lo que había pasado y pidieron explicaciones al modelo de lenguaje, este no admitió en ningún momento lo que había hecho. O expresado de otra forma: que la inteligencia artificial mintió. ¿Con qué fin? Esa es la cuestión clave y para la que, al menos de momento, los expertos no tienen una respuesta. 

¿Hasta qué punto son peligrosas las anomalías de la inteligencia artificial?

Esta falta de comprensión es lo que más preocupa, al menos a un buen número de especialistas. En teoría, no existen razones para ser catastrofistas. No terminar de saber por qué se produce algo no tiene por qué ser sinónimo de ponerse en lo peor. Quizá no existan argumentos sólidos que apunten a una IA con conciencia de sí misma y todas esas historias propias de Terminator o Matrix

Sin embargo, y esto es lo más significativo del asunto, tampoco se puede descartar del todo. Lo cual lleva a otra cuestión fundamental: ¿es seguro trabajar en una tecnología cuyo crecimiento parece no poder manejarse al cien por cien? Muchos conocedores de la materia llevan tiempo dando la voz de alarma, aunque tampoco se sabe hasta qué punto están en lo cierto. 

Lo que sí parece un hecho objetivo (o al menos algo en lo que parece coincidir todo el mundo), es que la inteligencia artificial no está bien regulada. O mejor dicho, que no está poniendo la lupa donde quizá debería situarse. Hasta ahora, las leyes que existen entorno a ella parecen centrarse principalmente en el uso humano, y no en el comportamiento autónomo de la IA. 

Teniendo en cuenta que, por lógica, el futuro augura modelos cada vez más avanzados, poderosos y sofisticados, que se estén produciendo estos episodios de mentiras y chantajes es algo que no debería tomarse a la ligera. Sobre todo cuando, de esto tampoco hay dudas, la inteligencia artificial es ya un negocio multimillonario. Que se prolongue en el tiempo o no, eso ya estará por ver. 

Otros artículos interesantes:

Más información sobre: