Ni imitación ni competencia: esto es lo que realmente distingue a DeepSeek de otros modelos de IA

Noticia

31 ene 2025 - 19:00

DeepSeek ha igualado a modelos de IA como GPT-4 de OpenAI, Llama 3.1 de Meta y Claude 3.5 Sonnet de Anthropic con un coste más bajo que nunca. La capacidad de razonamiento de esta inteligencia artificial ha marcado la diferencia.

Estados Unidos ha dominado en inteligencia artificial durante años con empresas como OpenAI, Google o Meta, pero eso acaba de cambiar con la llegada de DeepSeek. Esta IA diseñada en China utiliza el modelo DeepSeek-R1 y se ha convertido en un duro competidor para ChatGPT.

DeepSeek se diferencia de otros modelos en su arquitectura y capacidad de razonamiento, pero también en el precio. China ha diseñado lo que se conoce como inteligencia artificial barata con una tasa de 0,14 dólares por millón de tokens. GPT-4o de OpenAI cobra 7,50 dólares por millón de tokens.

Después de apenas unos días en el mercado, DeepSeek-R1 se ha convertido en una opción atractiva para empresas que buscan un modelo de IA de alto rendimiento con gastos operativos bajos.

DeepSeek prioriza el código abierto

Algunas empresas como OpenAI apostaban por el código abierto en sus inicios, pero eso ha ido cambiando con el desarrollo de modelos GPT propios. La empresa de Sam Altman ha terminado imponiendo algunas barreras.

DeepSeek representa lo opuesto con una filosofía de código abierto, lo que permite a los investigadores, desarrolladores y empresas modificar esta IA e integrarla en sus ecosistemas con mayor facilidad. Los usuarios también pueden decantarse por esta opción si no quieren estar atados a un modelo propio de una compañía.

Mayor eficiencia computacional a bajo coste

DeepSeek-R1 supera en eficiencia computacional a GPT-4 gracias a su arquitectura Mixture-of-Experts (MoE), un sistema que activa solo las partes relevantes para cada operación. El modelo chino tiene 671.000 millones de parámetros, pero solo 37.000 millones están activos simultáneamente. Esta es la clave del elevado rendimiento de esta IA de bajo coste.

OpenAI no puede competir con GPT-4 con sus 1,8 billones de parámetros. El modelo de la empresa de Sam Altman requiere una potencia computacional mayor, lo que genera unos costes operativos más altos.

El uso de los recursos también es la clave en la relación entre eficiencia y precio. DeepSeek ha conseguido igualar en rendimiento de IA a modelos como Llama 3.1 de Meta y Claude 3.5 Sonnet de Anthropic con un presupuesto estimado de solo 5,6 millones de dólares.

El entrenamiento de DeepSeek ha influido en el coste. La IA china utiliza GPU H800, una versión algo más reducida del GPU H100 de Nvidia. La compañía ha tenido que sortear los bloqueos que ha impuesto Estados Unidos a la exportación.

DeepSeek-R1 supera en razonamiento a GPT-4o

DeepSeek destaca en razonamiento, codificación y operaciones matemáticas, superando a GPT-4o centrado en la lógica y generación de código. La IA china utiliza el sistema de cadena de pensamiento (CoT) para descomponer los problemas en soluciones paso a paso. ChatGPT sigue siendo superior en habilidades de conversación y escritura creativa.

El idioma es otra de las grandes diferencias de esta inteligencia artificial. Mientras que DeepSeek es bilingüe por diseño en inglés y chino, la mayoría de los modelos de IA están optimizados para usuarios de habla inglesa. El lenguaje puede ser una ventaja competitiva para DeepSeek-R1, pero por el momento aún mezcla ambos idiomas en las respuestas.

Computer Hoy

Ni imitación ni competencia: esto es lo que realmente distingue a DeepSeek de otros modelos de IA

DeepSeek prioriza el código abierto

Mayor eficiencia computacional a bajo coste

DeepSeek-R1 supera en razonamiento a GPT-4o

Otros artículos interesantes:

Más información sobre: