ChatGPT ahora puede crear esta imagen: parece una tontería pero es un avance gigante para la IA

Imagen generada con IA/ChatGPT

ChatGPT ha logrado por fin generar una imagen de una copa de vino llena, algo imposible hasta la llegada del modelo de IA más avanzado, GPT-4o. Gracias a un entrenamiento más agresivo, el chatbot no tiene prácticamente limitaciones.

Generar una copa de vino llena con ChatGPT era imposible hasta ahora y, aunque parezca un logro minúsculo, es un gran avance para el chatbot de OpenAI.

Hasta ahora, daba igual cómo le pidieras a este asistente con inteligencia artificial: "una copa de vino llena", "una copa de vino a rebosar", "una copa de vino a punto de derramarse"...

Cualquier prompt o indicación daba resultado siempre la misma imagen, una copa de vino a la mitad o, en muchos casos, más llena, pero nunca a rebosar. Este simple hecho se hizo muy viral hace algunos meses e incluso llegaron explicaciones desde la filosofía de David Hume.

Pero parece ser que la respuesta es algo más mundana, según las explicaciones de otros usuarios, más acertadas. 

En tal caso, hay que conocer cómo se entrenan este tipo de modelos, que usan datos ya existentes para alimentar su inteligencia con una base lo más extensa posible. Por ello, lo más probable es que ChatGPT no ofreciera copas de vino llenas por no tener grandes ejemplos de esto.

Esto es lo que se conoce como sobrerrepresentación, que puede condicionar durante el entrenamiento los resultados que el modelo finalmente acabe mostrando a los usuarios.

Si realizas una búsqueda rápida en Google con el término "copa de vino llena" y te diriges a imágenes, notarás al momento que ninguna de estas llega a rebosar, ya que nadie en su sano juicio serviría una copa a punto de derramarse; al menos, no en el ámbito profesional.

En este sentido, las copas que aparecen a la mitad, a las que ya se asocia el concepto de "lleno", son las mayoritarias y pueden eclipsar los demás resultados, como una copa generada por IA que, verdaderamente, esté llena, como la de la imagen que ilustra este contenido.

El gran cambio en ChatGPT, que ha logrado generar definitivamente una copa de vino llena, se debe a la última actualización de OpenAI, con la versión GPT-4o, la más avanzada de la industria según sus posibilidades.

Para afinar los resultados, los datos de entrenamiento han sido cruzados, para que el modelo sea capaz de interpretar las imágenes en relación con el lenguaje empleado, lo que OpenAI ha denominado como "postentrenamiento agresivo".

Además de las copas de vino, ahora el modelo también ha perfeccionado los resultados que antes no eran correctos, como las imágenes con muchas personas, los relojes con horas que no cuadraban o los logos de marcas.

Otros artículos interesantes: