El modelo chino DeepSeek-R1 supera a OpenAI o1 en benchmarks clave de IA

China ya es capaz de ofrecer algunos modelos de inteligencia artificial, incluso mejores que el modelo más avanzado de OpenAI. Así funciona DeepSeek R1.
Existe una particular carrera por ofrecer el modelo de inteligencia artificial más avanzado del mercado, y no solo entre distintas compañías de Estados Unidos, sino también a nivel mundial con el avance de ciertas propuestas del mercado chino.
Resulta sorprendente que el laboratorio chino DeepSeek haya lanzado una versión abierta de R1, es decir, su modelo de razonamiento basado en inteligencia artificial más avanzado, y que rivaliza, e incluso también supera en ciertos aspectos, al modelo o1 de ChatGPT de OpenAI.
En concreto, R1 de DeepSeek supera a o1 de OpenAI en AIME, MATH-500 y SWE-bench Verified.
Para entenderlo, AIME emplea otros modelos para evaluar el rendimiento; luego MATH-500 es una amalgama de problemas de razonamiento; mientras que SWE-bench Verified se centra en distintas tareas de programación.
Es decir, al ser un modelo de razonamiento, R1 se verifica a sí mismo.
Esto hace que sea un modelo que pueda tardar un poquito más a responder que otros modelos más generales, pero al menos sí que ofrece respuestas más confiables en algunos entornos, como la ciencia, las matemáticas y la física.
Lo sorprendente es que este modelo R1 de DeepSeek contiene 671.000 millones de parámetros, unos parámetros que corresponden a las habilidades de resolución de problemas.
En todo caso también han publicado otras versiones de este modelo más simplificadas, incluso lo suficientemente pequeñas como para ejecutarse en cualquier ordenador portátil.
En lo que respecta al modelo R1 completo no funcionaría en un ordenador portátil al uso, dado que requiere un hardware mucho más potente, pero al menos sí que la API está a un precio bastante competitivo, por lo menos si lo comparamos con los modelos de OpenAI.
Veremos cómo avanza esta carrera tecnológica entre Estados Unidos y China para ofrecer el modelo de inteligencia artificial más avanzado del mercado.