Se está creando la primera generación "analfabeta" que no aprende nada: no hay creatividad, la basura generada con IA inunda internet

Se está creando la primera generación "analfabeta" que no aprende nada
Se está creando la primera generación "analfabeta" que no aprende nadaGenerada con IA

La IA promete grandes cosas, pero también está creando un gran problema: genera tanto contenido de baja calidad que se está creando una generación casi analfabeta.

Esto es algo fácilmente comprobable: cada vez hay más textos, imágenes y videos que parecen iguales y que carecen de ese toque diferencial de cada de humano. 

Gran parte de todo esto viene de la IA generativa, que son capaces de crear contenido por sí mismas usando todo lo que encuentran en Internet. El gran ejemplo es ChatGPT, y si bien es una herramienta de gran valor en la actualidad, el problema es que ahora la IA empieza a aprender de su propio contenido. 

En pocas palabras, si se alimenta solo con contenido generado por otras IA, la calidad y la originalidad van desapareciendo. Eso es lo que algunos expertos llaman model collapse o colapso del modelo. Aunque es verdad que se ha hecho más conocida la frase de 'Entrada de Basura, Salida de Basura' (Garbage In/Garbage Out o GIGO, por sus siglas en inglés).

Este colapso tiene tres causas principales. Primero, la acumulación de errores que se perpetúan y amplifican generación tras generación de modelos. Segundo, la pérdida de datos 'raros' o poco frecuentes, que terminan siendo descartados, lo que empobrece la diversidad y riqueza de la información.

El gran peligro de que la IA acabe copiándose a sí misma

El gran problema de todo esto, es que, lo que antes podía sorprender, ahora suena repetido. Investigadores lo llaman música de ascensor visual, es decir, imágenes y textos correctos, pero sin alma.

Esto al final puede derivar en un grave problema. Por ejemplo, si un estudiante usa solo textos generados por IA para hacer un trabajo, puede estar perdiendo la oportunidad de aprender de fuentes originales y mejores. O si un médico consulta información médica basada en textos de IA, podría no tener toda la información necesaria para diagnosticar una enfermedad.

Quizá no te des cuenta, pero cuando buscas algo en Google, lees noticias o te metes un foro, estás interactuando con una enorme de información que mezcla textos humanos y generados por IA. Eso puede influir en lo que crees, en cómo te informas y en las decisiones que tomas.

Ahmed Elgammal, profesor de informática en Rutgers, comenta que esto ya provoca un estancamiento cultural. Cuando la IA solo aprende de sí misma, pierde capacidad de innovar. Y lo peor es que esto ocurre sin entrenar la máquina con nuevos datos. Solo con usarla repetidamente, empieza a generar contenido seguro y aburrido, y la creatividad humana desaparece por completo.

"El riesgo no es solo que los futuros modelos entrenen sobre contenido de IA, sino que la cultura ya se filtra para favorecer lo familiar y lo cómodo”, dice Elgammal.

Es por todo esto que algunos investigadores están trabajando para crear archivos y bases de datos con contenido original, anterior a la explosión de la IA generativa. Por ejemplo, proyectos como LowBackgroundSteel.ai recopilan sitios web, textos y datos creados antes de 2022 para que no se pierdan.

También hay iniciativas como el Arctic Code Vault de GitHub, que guardó una copia de millones de líneas de código open source en una mina en Noruega, como un archivo para futuras generaciones. Son como cápsulas del tiempo digitales que preservan la esencia humana en la red.

Además, se están creando técnicas para que los modelos de IA puedan identificar y diferenciar el contenido generado por humanos del generado por máquinas, y así evitar que se 'autoalimenten' con textos sintéticos que degradan su calidad.

Ver sus artículos

Carolina González

Redactora

Carolina González, redactora de actualidad, reportajes a fondo, análisis de todo tipo de productos y vídeos para el canal de Youtube.