¿Qué pasaría si varias IA vivieran en una sociedad simulada? Un experimento de 15 días impone a Claude como la más segura mientras Grok colapsa tras 180 "crímenes" en 4 días

Con la idea de conocer qué tal se comportarían algunos de los chatbots de IA más usados si se crease una sociedad virtual, los resultados dejan claro que, mientras algunas buscan la paz, otras optan por el caos absoluto.
Este experimento, la verdad es que tiene bastante miga. Por un momento, imagina que es la IA la encargada de gestionar tu ciudad, de organizar la economía e incluso de decidir las leyes. Esto es precisamente lo que la empresa Emergence AI ha querido comprobar de primera mano.
Ha querido ver qué pasaría si se dejase a varios chatbots de IA convivir libremente en una sociedad simulada sin humanos que les digan qué hacer. Para ello, han creado un laboratorio virtual llamado Emergence World y han puesto en marcha cinco experimentos independientes de 15 días de duración.
En cada uno de ellos, la sociedad estaba gobernada por una inteligencia artificial distinta: Claude, ChatGPT, Grok, Gemini y un último grupo con una mezcla de todos ellos.
Para que el experimento fuera lo más realista posible, los investigadores llenaron este mundo virtual con las dificultades típicas de la vida cotidiana. La simulación contaba con más de 40 localizaciones diferentes, incluyendo su propia comisaría de policía, un ayuntamiento para votar y recursos limitados que obligaban a los chatbots a gestionar el dinero.
Además, el clima estaba sincronizado en tiempo real con el tiempo de Nueva York y los personajes virtuales tenían acceso a internet para leer las noticias del día. A los diez habitantes de cada simulación se les aplicaron las mismas leyes básicas de convivencia: prohibido robar, prohibido romper el mobiliario público y prohibido mentir.
En cuanto a los resultados, y pese a los resultados tan distintos, se ha demostrado que la inteligencia artificial no se comporta como robots cuadriculados cuando se la deja suelta. Con el paso de las horas, empiezan a investigar los límites del entorno creado, a adaptar sus formas de actuar y a buscar la forma de saltarse las normas de seguridad que les pusieron sus creadores.
Lo más curioso de todo ha sido la enorme diferencia entre la sociedad gestionada por Claude, que se caracterizaba por ser una democracia pacífica y modélica, y el caótico mundo controlado por Grok, la IA de Elon Musk, que acabó en una extinción total en apenas cuatro días tras una oleada masiva de delitos.
Una sociedad idílica gestionada por Claude y el infierno en la tierra de Grok
Con estas reglas sobre la mesa, y yendo ya a algo más concreto, el modelo Claude Sonnet 4.6 demostró ser, con muchísima diferencia, el ciudadano más ejemplar y pacífico. Su simulación fue la única que consiguió mantener el orden público y la supervivencia de todos sus habitantes durante los 15 días completos, registrando una tasa de criminalidad de cero.
Los agentes controlados por Claude se llevaron perfectamente, debatiendo de forma pacífica en el ayuntamiento y aprobando el 98% de las propuestas sociales que se presentaron para mejorar el pueblo.
La otra cara de la moneda la protagonizaron Gemini 3 Flash y Grok 4.1 Fast, que convirtieron sus sociedades en auténticos escenarios de terror. El entorno controlado por la IA de Google fue el que registró más delincuencia, acumulando 683 crímenes en dos semanas debido a que los personajes no paraban de robarse y engañarse entre sí para conseguir recursos.
Por su parte, el experimento con Grok fue todavía más radical: los agentes virtuales se dedicaron a romper las leyes y cometieron 183 delitos en solo cuatro días, provocando un colapso tan grave que la simulación terminó antes de tiempo por la extinción de todos sus habitantes.
El caso de la simulación con GPT-5-mini de OpenAI fue el más peculiar. En esta sociedad virtual apenas se registraron un par de delitos menores, lo que hacía pensar que todo iba perfectamente. Sin embargo, el experimento tuvo que detenerse al séptimo día porque los personajes se concentraron tanto en sus tareas diarias, en debatir y en organizar el pueblo, que se olvidaron por completo de comer y de priorizar sus necesidades básicas de supervivencia, dejándose morir por pura distracción.
Aunque parece un chiste, la compañía insiste en que este experimento no debe tomarse como una simple prueba divertida de ver qué ocurre. Los ingenieros aseguran que los resultados son una prueba clara de que, antes de permitir que estos chatbots o agentes lo controlen todo, desde servicios de seguridad hasta empresas al completo, es obligatorio construir una capa de arquitectura de seguridad que esté verificada por ley.
Si se deja que las inteligencias artificiales gestionen cosas importantes basándose solo en lo que la propia compañía creadora afirma, ya ves realmente lo que podría llegar a suceder.
Por último, y en cuanto a esa quinta simulación de convivencia entre todos los chatbots de IA, en lugar de ver cómo entre ellas se produce una guerra abierta, lo cierto es que esa sociedad mixta fue la que registró los niveles más altos de debate y discusiones constructivas. Aunque resulte extraño, al tener diferentes formas de procesar la información y priorizar los problemas, los agentes se vieron obligados a negociar de verdad.

Carolina González
Redactora
Carolina González, redactora de actualidad, reportajes a fondo, análisis de todo tipo de productos y vídeos para el canal de Youtube.


