DeepSeek saca de quicio a OpenAI: su "destilación de modelos" es capaz de "crear IA como churros"

Montaje/Pixabay

La inteligencia artificial de Sam Altman lucha fuertemente con la IA de Liang Wenfeng. Esta vez la propuesta china es juzgada por su técnica de entrenamiento de modelos. La táctica que están utilizando no se parece a ninguna vista en IA como Gemini, Copilot y otras.

La guerra entre DeepSeek y ChatGPT ha comenzado tras las novedades de la nueva IA china que ha llegado al mercado con su tecnología R1

El gran debate que ha traído el CEO de OpenAI a la mesa es ahora sobre el tipo de entrenamiento que está aplicando Liang Wenfeng en su IA, el cual parece que no lo termina de convencer, a pesar de que Altman ha elogiado el trabajo de esta nueva propuesta.

Por lo visto, la táctica que están utilizando no se asemeja a ninguna vista en inteligencias artificiales como Gemini, Copilot u otras. 

Ahora, ha salido a la luz algo que podría poner en riesgo la integridad de DeepSeek y se trata sobre su manera de crear los modelos para ahorrar recursos y dejarlos en código abierto. La cuestión es que parte de estas acciones están afectando a la compañía encargada de ChatGPT, Operator y DALL-E.

DeepSeek podría estar infringiendo las normas de OpenAI con su método de destilación de modelos

Aunque DeepSeek está revolucionando la industria de las IAs, los expertos de Financial Times han confirmado que OpenAI cree que se han guiado de su modelo todo este tiempo.

En vista del gran crecimiento que ha tenido esta inteligencia artificial china, los expertos de la compañía de Sam Altman se han puesto manos a la obra para saber más sobre su competencia. Lo que han encontrado responde varias preguntas sobre la potencia y bajo precio que ofrece.

Todas las pistas apuntan a que los desarrolladores de DeepSeek han estado haciendo uso de la técnica machine learning conocida como “destilación”, usando a ChatGPT como referencia

¿Qué quiere decir esto? Pues que la empresa podría haber usado la IA de OpenAI como “modelo padre o profesor” (el que enseña) para lograr pasarlos a su proyecto, que sería el “modelo hijo o estudiante” (el que aprende). De este modo, es capaz de contar con las mismas capacidades a pesar de ser compacto.

"El problema es cuando lo sacas de la plataforma y lo haces para crear tu propio modelo para tus propios fines", comenta OpenAI a Financial Times. En términos legales, esto podría acarrear una situación delicada entre ambas compañías, ya que DeepSeek estaría infringiendo las normas de OpenAI de manera directa al usar su propia IA para competir con ella. 

La destilación de modelos, al ser un método que recicla el aprendizaje de redes neuronales de un ente, también es capaz de facilitar todo el proceso. Además, permite crear IA como churros, reducir el peso y la exigencia de los recursos, haciéndolo incluso más barato.

Si esto es cierto, el hecho de ponerlo como una opción de código abierto podría traerle problemas a la compañía de Liang Wenfeng, especialmente porque han mencionado que deben proteger sus modelos para impedir situaciones en las que empresas de otros países se apoderen de la tecnología estadounidense.

Esto dice mucho sobre la guerra comercial que hay entre China y Estados Unidos. Por ahora, todavía es un tema que siguen investigando, así que hay que esperar a ver qué le depara al futuro de DeepSeek.

Otros artículos interesantes: