DeepSeek en versión low-cost: investigadores la recrean por solo 30 dólares

Un grupo de expertos ha logrado generar un modelo alternativo de la IA china que compite con OpenIA. El resultado ha sido impresionante y no ha costado ni el 1%.
La inteligencia artificial de Liang Wenfeng ha dado un paso importante en la industria, presionando así a competencias como ChatGPT, Gemini, Meta y Copilot.
Sin embargo, más allá de convertirse en un rival, muchos investigadores han tomado su sistema como referencia para aprender de la tecnología DeepSeek R1.
Este es el proyecto más barato y potente de la actualidad, pero hay una forma de hacerlo aún más económico, aunque de una manera reducida y con menos alcance.
Recientemente, esto se ha logrado gracias a un equipo de investigadores de la Universidad de California, Berkeley.
DeepSeek puede ser una base sólida para la creación de IAs inferiores

Un nuevo proyecto está llamando la atención de muchas personas. El estudiante de doctorado Jiayi Pan, que forma parte del Berkeley AI Research (BAIR), ha compartido en Nitter el proceso de una investigación muy interesante para la industria de la inteligencia artificial.
El equipo se ha centrado en trabajar con DeepSeek R1-Zero para generar un modelo ligero y compacto que pueda ser incorporado a un juego Countdown para ver cómo se comporta.
Si bien hicieron la prueba con varios tipos, como 0.5B, 1.5B, 3B y 7B, llegaron a la conclusión de que 3 mil millones de parámetros (3B LM) es el tamaño ideal para que funcione adecuadamente.
En comparación con la versión original, serían aproximadamente unos 668 mil millones de parámetros menos.
Para la cuenta atrás, el modelo aprende a hacer búsqueda y auto-verificación. Para el número multiplicación, el modelo aprende a descomplicar el problema usando la regla de desactivación y resolverlo paso a paso. Y cuesta 30 dólares entrenar el modelo. Esperamos que este proyecto ayude a desmitificar la investigación emergente de escala de RL y hacerla más accesible. — Jiayi Pan.
Con una base de modelo de lenguaje (LM) y RL han logrado procesar el entrenamiento con éxito. En un principio, solo daba respuestas aleatorias, pero Countdown con la IA, ha sido capaz de corregirse así misma y solucionar problemas con razonamiento.
Al mismo tiempo, el aprendizaje automático se mantiene ejecutándose, por lo que a medida que avanza, obtiene más información y mejora de forma exponencial. El código de Jiayi-Pan se encuentra en GitHub y el seguimiento de todo el proyecto en Wandb.
Lo más impactante de todo esto es que la recreación de esta IA ha salido en tan solo 30 dólares (aproximadamente 28,87 euros) debido a que han utilizado las fichas de 0,55 dólares por millón de fichas de DeepSeek, siendo un total de 54 paquetes.
Con OpenAI, donde vale 15 dólares por millón de fichas, tal vez les habría costado alrededor de 810 dólares (aproximadamente 779,58 euros).
Esto sin duda hace la diferencia y demuestra que DeepSeek está siendo un modelo ideal para obtener resultados impresionantes por un precio sumamente bajo.