Expertos alarmados acusan a ChatGPT de contaminar internet: "El contenido generado por humanos está desapareciendo y no tenemos copia"

Generada con IA

Expertos alertan sobre la necesidad de distinguir entre contenido humano y contenido de IA, y de preservar el primero para que siga siendo la base del conocimiento.

Teniendo en cuenta el boom de la inteligencia artificial y que actualmente hay una gran cantidad de contenido generado con esta tecnología, es normal que muchos sientan cierta desconfianza cuando leen algo en internet. 

La verdad es que, desde que la IA empezó a hacer famosa con herramientas como ChatGPT, la cantidad de contenido generado por IA ha explotado, y eso está cambiándolo todo.

Algunos pensarán que qué hay de malo en eso, pero lo cierto es que, aunque estas máquinas son muy listas, no piensan ni sienten como los humanos. Y si los modelos de inteligencia artificial se entrenan con textos que ellas mismas han creado, poco a poco van perdiendo el contacto con lo que realmente significa ser humano, con la creatividad, la emoción y la complejidad de nuestro lenguaje.

En pocas palabras, si se alimenta solo con contenido generado por otras IA, la calidad y la originalidad se van diluyendo. Eso es lo que algunos expertos llaman model collapse o colapso del modelo. Aunque es verdad que se ha hecho más conocida la frase de 'Entrada de Basura, Salida de Basura' (Garbage In/Garbage Out o GIGO, por sus siglas en inglés). 

Este colapso tiene tres causas principales. Primero, la acumulación de errores que se perpetúan y amplifican generación tras generación de modelos. Segundo, la pérdida de datos 'raros' o poco frecuentes, que terminan siendo descartados, lo que empobrece la diversidad y riqueza de la información. 

 ¿Por qué es tan importante preservar el contenido humano original?

Yendo al grano, porque es la base sobre la que se construye todo lo demás. Los modelos de IA aprenden a partir de grandes cantidades de datos, y si esos datos no dejan ver la realidad humana, la IA tampoco podrá entendernos bien ni ayudarnos. 

Por ejemplo, si quieres que un chatbot te explique un tema médico, lo que sería perfecto es que haya aprendido de textos escritos por expertos reales, no de respuestas generadas por otras máquinas que pueden tener errores.

Quizá no te des cuenta, pero cuando buscas algo en Google, lees noticias o te metes un foro, estás interactuando con una enorme de información que mezcla textos humanos y generados por IA. Eso puede influir en lo que crees, en cómo te informas y en las decisiones que tomas.

Según Sam Altman, CEO de OpenAI, se generan ya más de 100.000 millones de palabras al día con IA, muchas de ellas accesibles en internet

Por ejemplo, si un estudiante usa solo textos generados por IA para hacer un trabajo, puede estar perdiendo la oportunidad de aprender de fuentes originales y mejores. O si un médico consulta información médica basada en textos de IA, podría no tener toda la información necesaria para diagnosticar una enfermedad.

Un estudio de Bloomberg Research puso este problema en perspectiva, analizando cómo once de los principales modelos de lenguaje, incluyendo GPT-4o y Llama-3, utilizaban más de 5.000 indicaciones dañinas, que "producían malos resultados".

¿Qué están haciendo para salvar el contenido humano?

Algunos investigadores están trabajando para crear archivos y bases de datos con contenido original, anterior a la explosión de la IA generativa. Por ejemplo, proyectos como LowBackgroundSteel.ai recopilan sitios web, textos y datos creados antes de 2022 para que no se pierdan.

También hay iniciativas como el Arctic Code Vault de GitHub, que guardó una copia de millones de líneas de código open source en una mina en Noruega, como un archivo para futuras generaciones. Son como cápsulas del tiempo digitales que preservan la esencia humana en la red.

Además, se están creando técnicas para que los modelos de IA puedan identificar y diferenciar el contenido generado por humanos del generado por máquinas, y así evitar que se 'autoalimenten' con textos sintéticos que degradan su calidad.

Otros artículos interesantes:

Ver sus artículos

Carolina González

Redactora

Carolina González, redactora de actualidad, reportajes a fondo, análisis de todo tipo de productos y vídeos para el canal de Youtube.