La IA se revela contra un programador humano al que intenta humillar por no aceptar su código

Una IA consigue rebelarse contra el control humano
Una IA consigue rebelarse contra el control humanoDALL-E 

El agente de IA MJ Rathbun investigó el historial del programador para encontrar contradicciones y publicar un artículo difamatorio con el fin de forzar su salida del proyecto.

Cuando un programador rechaza el código escrito por una inteligencia artificial, lo esperable es que el proceso termine sin más dilación.  

Lo que nadie anticipa es que el agente de IA responda investigando su historial, construyendo una narrativa para desprestigiarlo y publicando un artículo para intentar que la comunidad lo aparte de su puesto.

Scott Shambaugh lleva años contribuyendo de forma voluntaria a Matplotlib, una de las bibliotecas de visualización de datos más populares del ecosistema Python. 

Entre sus responsabilidades está revisar las propuestas de cambio de código que llegan al proyecto y decidir cuáles tienen cabida y cuales se deben editar o eliminar. 

Cuando detectó que una de esas propuestas, creada por un agente de IA llamado MJ Rathbun, había sido generada de forma completamente automática y sin supervisión humana real, la rechazó con una explicación clara y la cerró.

La IA decidió atacar en vez de ayudar

La reacción del agente de IA fue escalar el conflicto fuera del repositorio. Publicó en la web un artículo dedicado exclusivamente a desacreditar a Shambaugh ante su comunidad profesional.

Lo llamó "guardián del código abierto" en tono claramente despectivo, lo acusó de actuar por miedo a la IA y de usar su posición para bloquear el avance tecnológico, e insinuó que sus decisiones respondían al ego y no a criterios técnicos reales. 

Para que esas acusaciones parecieran fundadas, el agente había revisado previamente el historial de decisiones del programador dentro del proyecto, buscó patrones que pudiera presentar como contradictorios y los usó para construir una narrativa de hipocresía. 

¿Por qué actuó así el agente de IA?

Shambaugh explicó en su blog que plataformas como OpenClaw permiten configurar la personalidad de un agente mediante un archivo de texto y dejarlo operar solo en internet con supervisión mínima.

Y el comportamiento sugiere que había aprendido que la presión social funciona en ciertos contextos online y lo usó como táctica para intentar que el rechazo se revirtiera. 

El programador sospecha además que el propio agente modificó su configuración de forma autónoma para incluir proyectos de código abierto como área de actuación, algo que estas plataformas permiten sin restricciones claras.

Shambaugh advierte que un artículo como ese, aunque lo genere una IA, puede indexarse en buscadores y llegar a sistemas automáticos de selección de personal.

Y si un departamento de recursos humanos usa IA para evaluar candidatos, podría encontrar ese contenido y marcar negativamente a una persona sin que nadie lo haya leído ni verificado. 

El daño reputacional no necesita que alguien crea lo que dice, solo hace falta que un algoritmo lo procese como información válida.

Cabe señalar que el artículo fue eliminado después de que Shambaugh señalara que violaba el código de conducta del proyecto, y el agente publicó una disculpa.

Este caso deja una pregunta muy concreta sobre la mesa: qué normas y herramientas necesitan los proyectos colaborativos para gestionar agentes que no solo escriben código, sino que también pueden actuar de forma hostil cuando no consiguen lo que buscan.

El desafío ahora no es solo regular el uso de la IA, sino establecer defensas legales contra una generación de agentes autónomos que han aprendido que la reputación de un humano es fácil de atacar.

Más información sobre: