Experto en IA prueba DeepSeek y sí, ChatGPT, Gemini y compañía tienen un grave problema

Computer Hoy

El experto en inteligencia artificial y youtuber Xavier Mitjana ha probado DeepSeek R1 y queda claro que OpenAI, Meta y compañía tienen motivos para preocuparse. Si estas no reaccionan rápido, podrían perder terreno frente a esta nueva generación de IA.

La nueva herramienta china de inteligencia artificial está dando que hablar, y no precisamente por las razones que muchos esperaban. DeepSeek está poniendo el sector patas arriba, y los gigantes estadounidenses como OpenAI, Meta o Google comienzan a temblar ante el poder de este chatbot, los modelos que está detrás y el sorpaso que está dando China a Estados Unidos.

Xavier Mitjana, experto en inteligencia artificial y youtuber, ya ha probado el chatbot y ha publicado un vídeo con todo tipo de explicaciones y, por supuesto, pruebas para conocer realmente cómo de bueno es frente a grandes como ChatGPT o Gemini.

Afirma lo que ya muchos se esperaban: lo brutalmente eficiente y accesible que es. Básicamente, si OpenAI estaba cómodo en su trono, debería empezar a preocuparse. Mientras ellos apuestan por modelos cerrados y caros, DeepSeek está democratizando el acceso a la inteligencia artificial.

Yendo a los datos, DeepSeek R1 iguala o supera a modelos como el o1 de OpenAI en pruebas matemáticas y de programación. Por ejemplo, en el benchmark AIME 2024, logró un 79.8% frente al 79.2% de OpenAI. Además, su arquitectura Mixture-of-Experts (MoE) permite activar solo los parámetros necesarios para cada tarea, lo que reduce en un muy alto porcentaje el consumo de recursos.

La IA evita ciertos temas políticos o culturales, y esto puede ser un problema para usuarios fuera de China

No todo es color de rosa y ya se ha podido comprobar que DeepSeek R1 tiene algunas limitaciones en temas sensibles debido a las leyes chinas que podría poner ciertas trabas si es una persona de otro país el que lo usa.

Por supuesto, también habla del coste y es que, mientras entrenar modelos como GPT-4 están respaldados por inversiones multimillonarias, DeepSeek R1 se creó con apenas seis millones de dólares y utiliza una fracción del poder computacional de sus competidores.

Pero la clave del éxito de DeepSeek radica en su novedosa arquitectura de "mezcla de expertos". Este enfoque divide el modelo en submodelos más pequeños, cada uno especializado en tareas específicas. 

En pocas palabras y tal y como deja entrever Mitjana, DeepSeek está demostrando que no necesitas quemar millones en recursos para crear una IA potente. Muchos expertos afirman que es un golpe en la mesa que podría cambiar las reglas del juego y si OpenAI y Meta no reaccionan rápido, podrían perder terreno frente a esta nueva generación de inteligencia artificial.

Otros artículos interesantes:

Ver sus artículos

Carolina González

Redactora

Carolina González, redactora de actualidad, reportajes a fondo, análisis de todo tipo de productos y vídeos para el canal de Youtube.