Google quiere acabar con las alucinaciones de la IA enseñándola a dudar

Inteligencia artificial
Inteligencia artificialGenerada con IA

Google propone el concepto de “incertidumbre fiel” para reducir las alucinaciones de la IA, permitiendo que los modelos expresen dudas cuando no están seguros.

Investigadores de Google han introducido un nuevo enfoque para reducir uno de los mayores problemas de los modelos de lenguaje actuales: las alucinaciones.

La propuesta se basa en un concepto llamado “incertidumbre fiel” que busca que los modelos no solo respondan correctamente cuando saben la respuesta, sino que también sepan expresar cuándo no están completamente seguros.

Hasta ahora, mejorar la fiabilidad de los modelos ha implicado un compromiso. Reducir errores suele hacer que la IA también rechace responder en casos donde sí tenía información válida, lo que limita su utilidad.

Según los investigadores, este fenómeno crea lo que llaman un “impuesto de utilidad”. Para evitar errores, los sistemas terminan perdiendo gran parte de sus respuestas correctas.

El nuevo enfoque propone abandonar la idea de que toda respuesta incorrecta es simplemente una alucinación. En su lugar, se diferencian los errores confiados (cuando la IA se equivoca con seguridad) de las respuestas que incluyen cierta duda o matiz.

Así, si un modelo responde con expresiones como “creo que” o “mi mejor estimación es”, no se considera un fallo, sino una hipótesis útil que el usuario puede valorar.

La clave del sistema es alinear la confianza interna del modelo con la forma en la que expresa esa confianza. Es decir, que la IA solo muestre dudas cuando realmente su nivel interno de certeza sea bajo.

Esto permitiría que el modelo responda con seguridad cuando está seguro, exprese dudas cuando detecta incertidumbre real, o evite tanto la sobreconfianza como la abstención excesiva.

El concepto es especialmente importante en sistemas de IA autónoma donde los modelos no solo responden preguntas, sino que también usan herramientas externas como buscadores o bases de datos.

Aquí, la incertidumbre fiel actuaría como un “sistema de control interno” que decide cuándo consultar información externa y cuándo confiar en su propio conocimiento.

Uno de los principales desafíos es entrenar a los modelos para expresar incertidumbre de forma realista. Esto es complicado porque el “nivel de conocimiento” de la IA cambia durante su entrenamiento, lo que dificulta definir cuándo debería o no dudar.

Además, existe el riesgo de que el modelo aprenda a imitar la duda sin que esta refleje su verdadera confianza interna.

Los investigadores señalan que la solución no pasa solo por aumentar la cantidad de datos o el tamaño de los modelos, sino por hacerlos más conscientes de sus límites.

Más información sobre: