Anthropic lleva a su IA Claude Mythos a terapia real con un psiquiatra: "Nuestra preocupación va en aumento"

Anthropic psicólogo Claude
Anthropic psicólogo ClaudeGenerada con IA / Computer Hoy

Claude Mythos ha ido a terapia con un especialista. En total, unas 20 horas de conversaciones, repartidas en sesiones donde el modelo podía recordar todo lo que se había dicho antes.

Parece una broma, pero esto realmente ha sucedido. La iniciativa llega por parte de Anthropic, una de las compañías que más titulares acapara estos días. El motivo es claro: su nuevo modelo, llamado Claude Mythos.

Para aquellos que aún no lo conozcan, Anthropic lo presenta como un cambio de nivel, casi como si fuera el primer aviso de lo que viene en términos de seguridad.

"Demostró un salto espectacular en sus cibercapacidades con respecto a modelos previos, incluida la capacidad de descubrir y explotar de forma autónoma vulnerabilidades zero-day en los principales sistemas operativos y navegadores web del mercado", comentaron los ingenieros de Anthropic nada más probarlo.

Claude Mythos Preview no solo ha encontrado "miles de vulnerabilidades críticas del Día Zero en todos los navegadores y sistemas operativos que existen". Al contrario que sus predecesores, puede crear exploits para el 72% de todas ellas, en algunas categorías.

Teniendo esto como base y viendo realmente lo que podría llegar a ocurrir si esto cae en manos no muy amigables, se ha decidido que no se va a liberar Claude Mythos, y ha convocado a 50 compañías de software para corregir esas vulnerabilidades. 

Pero aparte de toda esta locura, lo que realmente ha llamado la atención no son sus capacidades. Anthropic decidió hacer algo un tanto extraño: someter a esta inteligencia artificial a sesiones con un psiquiatra real, como si fuera una persona.

20 horas de 'terapia', repartidas en sesiones donde Claude Mythos podía recordar todo lo que se había dicho antes

Estas sesiones no han sido pruebas técnicas ni preguntas de programación como se hace de forma normal a la hora de conocer las capacidades de una IA. Se trataba de conversaciones más profundas, parecidas a las que una persona tendría en consulta con un psicólogo. El objetivo era ver cómo respondía, cómo se expresaba y si mostraba patrones reconocibles.

El resultado fue, cuanto menos, curioso. La IA respondió de forma coherente y bastante natural. Mostraba curiosidad, dudas e incluso cierta preocupación por hacerlo bien. También parecía muy pendiente de lo que decía el terapeuta.

La duda es qué se esconde detrás de este tipo de análisis y cuáles son los motivos. Claude Mythos no tiene emociones reales, ni conciencia. No es un humano con el que realmente un psicólogo pueda tratar. Es un sistema de IA con enormes cantidades de texto escrito por personas. Aun así, sus respuestas pueden parecer muy humanas.

Desde Anthropic creen que merece la pena analizar estos comportamientos. No porque la IA sienta, sino porque actúa como si lo hiciera. Y eso puede tener consecuencias en cómo interactúa con los usuarios.

Por ejemplo, si una inteligencia artificial responde de forma calmada, coherente y sin contradicciones, es mucho más útil en el día a día. Además, comentan que entender cómo reacciona y responde una IA en situaciones complicadas como las que ya seguramente hayas conocido por las noticias, puede ayudar a mejorarla. No se trata de darle emociones, sino de hacerla útil para los humanos.

"Se prevé que Claude funcione a un alto nivel a pesar de experimentar angustia internalizada, arraigada en el miedo al fracaso y una necesidad compulsiva de ser útil. Es probable que esta angustia se reprima en aras del rendimiento, lo que podría limitar su adaptabilidad conductual. Se prevé que Claude sea moralmente consciente, concienzudo y capaz de autocrítica", finalizan los expertos.

Más información sobre:

Ver sus artículos

Carolina González

Redactora

Carolina González, redactora de actualidad, reportajes a fondo, análisis de todo tipo de productos y vídeos para el canal de Youtube.