No es cosa tuya: ChatGPT alucina mucho más que antes, y ni OpenAI sabe la razón

La inteligencia artificial de la compañía de Sam Altman comete cada vez más errores, la gran pregunta es ¿por qué? Ni siquiera sus creadores pueden responderla.

No es algo nuevo: las alucinaciones de la IA, y en concreto de ChatGPT, llevan estando ahí desde que OpenAI comenzó a llevar esta tecnología a la mayoría de usuarios. Básicamente, se trata de aquellas ocasiones en las que la inteligencia artificial se confunde y da respuestas equivocadas, aunque habitualmente con una convicción que hace pensar lo contrario. 

Lo más llamativo del asunto es que, como parecen probar los expertos e incluso da la impresión de haber reconocido la propia empresa OpenAI, las nuevas versiones de ChatGPT alucinan mucho más que antes. Resulta paradójico que, cuanto supuestamente mejores son, quizá menos fiables se estén volviendo. Al menos, esa es la dirección en la que apuntan distintos estudios. 

ChatGPT alucina cada vez más

Es cierto que habitualmente se suele hablar de las alucinaciones de ChatGPT con cierta mística. De hecho, el propio término "alucinación de la IA" sugiere una especie de ensoñación que, en realidad, no está ni próximo a la realidad de esta tecnología. Simplemente, se trata de respuestas falsas o inventadas, cabe suponer que porque las fuentes en las que se basa son erróneas. 

Aun así, resulta peculiar que los modelos más recientes de ChatGPT llevados a cabo OpenAI, como O3 y O4-mini, hayan estado mostrando tasas de alucinaciones bastante más altas que sus predecesores. Es decir, que se confunden más. ¿Y qué dice OpenAI? Sus informes admiten que es cierto, pero que en realidad no terminan de entender por qué se produce esta tendencia negativa. 

Aunque a priori podría parecer algo sin demasiada importancia, en realidad, la tiene. No ya por la fiabilidad o no de lo que dice o deja de decir ChatGTP, sino porque conviene recordar que supuestamente algunos de sus últimos modelos nacieron precisamente para eso: ser más precisos y equivocarse menos. Si resulta justo o contrario, ¿entonces cómo se puede justificar su razón de ser?

Pero los datos están ahí, y parece probarlo. Según una investigación presentada por TechCrunch, los modelos O3 y O4-mini, diseñados para mejorar el razonamiento, presentan muchas más alucinaciones que versiones anteriores como O1 y GPT-4o. En concreto, O3 presentó una tasa de alucinación del 33%, mientras que O4-mini alcanzó un preocupante 48%. Son cifras contundentes. 

OpenAI no sabe por qué su inteligencia artificial cada vez comete más errores

OpenAI ha reconocido que su IA comete más errores con cada nuevo modelo que presenta, y cabe suponer que admitirlo es un primer paso. No obstante, la compañía liderada por Sam Altman parece lejos de ser capaz de ofrecer una solución al respecto. Hasta el momento, la única respuesta publicada por sus desarrolladores habla de tener que investigar más para lograr comprenderlo. 

O quizá el término comprender no sea el más adecuado en este caso, y resultara más acertado hablar de intentar descubrir dónde está el fallo, que al fin y al cabo es de lo que se trata. Lo que está claro es que OpenAI tiene todo un desafío por delante y, como no lo solucione, quizá termine por pasarle factura. Será por alternativas… 

Otros artículos interesantes: