DeepSeek lanza Janus Pro, su serie de modelos de generación de imágenes para competir con DALL-E 3 y Stable Diffusion

El ChatGPT chino que está ahora de moda acaba de lanzar una nueva versión de su modelo de generación de imágenes. En ciertos aspectos supera a DALL-E 3 y Stable Diffusion.
La inteligencia artificial ha sufrido un vuelco en estos últimos días con el advenimiento de un nuevo modelo de origen chino, llamado DeepSeek R1, y tal ha sido el terremoto que ha hecho perder hasta 580.000 millones de dólares a empresas como Nvidia y otras han caído en Bolsa.
El que se conoce ahora popularmente como el ChatGPT chino, DeepSeek R1, ha supuesto toda una sorpresa a celebridades como Sam Altman, responsable de ChatGPT, que quizás no se esperaba una competencia tan feroz desde China a corto plazo.
De hecho a partir de ahora, debe quedarse grabado en tu mente el nombre de Liang Wenfeng, el responsable de la startup china DeepSeek que, además de lanzar un modelo basado en texto que está causando auténtico furor en las tiendas de aplicaciones como la App Store, acaba igualmente de anunciar una versión mejorada de su modelo enfocado a generar imágenes basadas en IA.
Este nuevo modelo de generación de imágenes mejorado sustituye a una primera versión que lanzaron hace tiempo, y lo bueno del nuevo Janus-Pro-7B es que parece incluso estar por encima de algunos modelos ya establecidos como DALL-E 3 y Stable Diffusion XL, entre otros.
Eso sí, no los supera ampliamente, y se podría decir que pierde en otros tantos puntos de referencia, pero al menos sí que los ha logrado superar en un par de ellos, y eso es un gran avance.
No queda muy claro sobre el tamaño de las imágenes generadas por el nuevo Janus-Pro-7B, aunque a través de la demostración de Hugging Face se han entregado con un tamaño de 768×768 px.

En todo caso, puedes echar un vistazo arriba a las imágenes publicadas por la propia DeepSeek para ver cómo ha avanzado su modelo generador de imágenes inicial hasta el actual llamado Janus-Pro-7B.
Esta nueva familia de modelos Janus-Pro, varían desde los 1000 millones a los 7000 millones de parámetros, y el último es especialmente el interesante dado que está rivalizando con los modelos que conocemos a día de hoy de procedencia estadounidense.
DeepSeek afirma que su nuevo Janus-Pro-7B supera a otros modelos en dos puntos de referencia de evaluación de inteligencia artificial como GenEval y DPG-Bench.
"Janus-Pro supera el modelo unificado anterior e iguala o supera el rendimiento de los modelos específicos de tareas. La simplicidad, la alta flexibilidad y la eficacia de Janus-Pro lo convierten en un candidato sólido para los modelos multimodales unificados de próxima generación", dice DeepSeek.
Veremos cómo avanza esta batalla por la carrera en inteligencia artificial que acaba de comenzar entre los actores de Estados Unidos y China.