Expertos alertan de los primeros signos de colapso de la inteligencia artificial: "Entrada de Basura, salida de Basura"

La calidad de la inteligencia artificial cae ante la acumulación de errores y datos incorrectos, afectando la precisión y fiabilidad de sus respuestas.
En los últimos meses, varios expertos en inteligencia artificial han empezado a levantar la voz ante un fenómeno preocupante, el colapso gradual de la calidad en los resultados generados por sistemas de IA.
La frase que se ha popularizado para describir este problema es "Entrada de Basura, Salida de Basura" (Garbage In/Garbage Out o GIGO, por sus siglas en inglés). Este problema no es menor, especialmente para quienes usan la inteligencia artificial no para crear historias o textos artísticos, sino para realizar búsquedas fiables y obtener datos concretos.
Y la gran sorpresa en lo que respecta a las búsquedas, herramientas como Perplexity superan claramente a Google. Sin embargo, incluso estas soluciones avanzadas empiezan a mostrar fallos importantes.
¿Qué es el colapso del modelo en la IA y por qué ocurre?
La realidad es que la búsqueda tradicional, tal como la conocíamos, está en un momento de crisis. Google, el gigante que domina el mercado de las búsquedas, ha apostado fuerte por incorporar inteligencia artificial en su motor, pero esto no ha resultado en mejoras evidentes.
De hecho, la precisión y fiabilidad de los resultados están decayendo. Esto se percibe claramente cuando se buscan datos específicos y rigurosos, como estadísticas financieras o cuotas de mercado.

Como explica Steven J. Vaughan-Nichols, periodista en The Register, en vez de obtener cifras oficiales provenientes de documentos como los informes 10-K (los reportes anuales requeridos para empresas públicas en EEUU), las respuestas tienden a provenir de sitios web de baja calidad, que apenas resumen o interpretan los datos originales, generando resultados inexactos y poco confiables.
Este fenómeno no se limita a una sola plataforma o modelo. El periodista indica que tras haber probado diversas IA líderes del mercado, la problemática persiste, porque las respuestas tienden a ser imprecisas o erróneas.
La raíz de este problema se encuentra en lo que los especialistas llaman el "colapso del modelo de IA". En términos sencillos, los modelos de IA que se entrenan usando sus propias respuestas (en lugar de fuentes externas confiables) terminan replicando y amplificando sus propios errores. Esto provoca un desgaste progresivo en la calidad de la información que generan.
Este colapso tiene tres causas principales. Primero, la acumulación de errores que se perpetúan y amplifican generación tras generación de modelos. Segundo, la pérdida de datos "raros" o poco frecuentes, que terminan siendo descartados, lo que empobrece la diversidad y riqueza de la información.
Y tercero, la creación de bucles de retroalimentación, que refuerzan ciertos patrones erróneos y sesgos, generando textos repetitivos o análisis distorsionados. Como señala la empresa Aquant, "cuando la IA se entrena con sus propios resultados, se aleja cada vez más de la realidad".
Un estudio reciente de Bloomberg Research puso este problema en perspectiva, analizando cómo once de los principales modelos de lenguaje, incluyendo GPT-4o y Llama-3, utilizaban más de 5.000 indicaciones dañinas, que "producían malos resultados".
Además, el uso irresponsable de la IA está acelerando la degradación general. Desde estudiantes que generan trabajos escolares sin verificar, hasta artículos falsos que circulan en medios, el ecosistema de información se contamina más rápido de lo que la tecnología puede corregir.
Como indica Vaughan-Nichols en el artículo: "Si tuviera que decidir entre contenido de calidad, que exige esfuerzo y dedicación genuina, y una IA que ofrece resultados pobres, sé cuál escogería la mayoría. […] hablamos de empresas que, bajo el pretexto de mejorar la eficiencia, en realidad buscan reducir plantilla para maximizar beneficios".
Según Sam Altman, CEO de OpenAI, se generan ya más de 100 mil millones de palabras al día con IA, muchas de ellas accesibles en internet. La cuestión es, ¿cuánto tardaremos en ver un colapso total?
