Empresa española avergüenza a ChatGPT: "Se puede equivocar el 60% de las veces y no miente como nosotros"

Computer Hoy

Una empresa española ha diseñado una inteligencia artificial con la que revisar las respuestas de chatbots como ChatGPT: no ha aprobado el examen. La herramienta de OpenAI tiene un margen de error de hasta el 60%.

La inteligencia artificial ya forma parte de la vida diaria de millones de personas, pero muchos siguen cuestionando la calidad de las respuestas. ChatGPT lidera tras la llegada de la IA china DeepSeek, pero una empresa española lo ha puesto a prueba.

Ninguno de los modelos se libra de las famosas alucinaciones de IA, ni GPT-4o de OpenAI, Gemini de Google, V3 de DeepSeek ni Claude de Anthropic. ChatGPT no ha superado las expectativas de los investigadores.

"No es consciente de que te está mintiendo, simplemente está repitiendo datos", ha explicado David Villalón, CEO y cofundador de la compañía Maisa, en una entrevista para el programa La Ventana. El chatbot no es consciente de que las respuestas que ofrece tienen errores.

La IA no es capaz de comprender las emociones humanas y replicarlas, por lo que no entiende el concepto "mentir". ChatGPT y otros chatbots toman como verdadera aquella información con la que han sido entrenados.

Los usuarios no pueden saber si la IA se equivoca si no comprueban posteriormente la información, uno de los puntos más criticados. La mayoría de los chatbots no muestran el proceso que han seguido para llegar a una respuesta, mentir sin que les descubran es mucho más fácil.

ChatGPT puede fallar hasta en el 60% de las respuestas

Los modelos de IA generativa como ChatGPT no "mienten" en el sentido humano, pero sí pueden dar respuestas incorrectas sin saberlo. "En preguntas factuales, se puede equivocar un 30% de las veces. Aunque en acciones más sencillas no llega al 2%", según David Villalón.

ChatGPT pierde fiabilidad cuando el proceso se va complicando y se van sumando tareas en cadena. El porcentaje de error del chatbot de OpenAI puede llegar a ser del 60% para acciones complejas en las que se mezclan conocimientos teóricos, lógica y toma de decisiones.

El CEO de Maisa asegura que hay un motivo detrás de las alucinaciones de IA: los chatbots generan texto en función de patrones previos sin una validación empírica. ChatGPT no es capaz de razonar en el sentido humano, solo puede predecir una respuesta que será la "más probable" en función de lo que ha visto antes.

ChatGPT será más transparente en sus respuestas

OpenAI pretende acabar con la poca fiabilidad de algunas respuestas de ChatGPT con el modelo GPT-4.5. El chatbot generará una cadena de pensamiento antes de responder, lo que permite modificar su razonamiento a mitad de proceso.

El nuevo modelo de OpenAI es el más potente hasta la fecha. GPT-4.5 podrá resolver problemas más complejos en áreas como lógica y física. Además, analiza sus respuestas para descubrir patrones y generar posibles conexiones en el futuro, algo que antes solo podían realizar los propios usuarios. 

ChatGPT tiene cierta intuición por primera vez, pero no es suficiente. Villalón asegura que el chatbot de la empresa de Sam Altman se sigue basando en la probabilidad en sus respuestas.

La tecnología de Maisa permite analizar, rastrear y auditar a las distintas inteligencias artificiales "¿Y si en vez de utilizar la IA para que me de respuestas, la utilizo para que me diga el camino que tengo que utilizar?", asegura Villalón cuando le preguntan por el origen de su empresa.

Otros artículos interesantes: