DeepSeek es la mayor prueba de que una IA de código abierto aún es posible

Aunque se ha polarizado la discusión sobre DeepSeek en una batalla entre Estados Unidos y China, la verdadera competición se da entre código abierto y propietario. Por qué es una gran noticia que este modelo sea open source.
DeepSeek es un fenómeno de masas como lo fue en su momento el lanzamiento de ChatGPT, de OpenAI. Las dudas de los usuarios no han hecho más que crecer y, con estas, también el desconocimiento y el ruido de fondo sobre temas tan importantes como la recopilación de datos o la seguridad.
Ambos modelos representan 2 extremos opuestos de la balanza, sobre todo por el tipo de licencia que permite; en el caso de DeepSeek, es código abierto con licencia MIT, así que puedes revisarlo, editarlo o usarlo para fines legítimos, en base a los principios del software libre.
Esta estrategia de China ha levantado muchas ampollas entre las compañías estadounidenses, cuyo software es privativo y cerrado, con lo cual solo se tiene a disposición del público lo que una u otra compañía quiera compartir.
Quizá el caso más sonado haya sido la caída en bolsa de NVIDIA, debido a que Liang Wenfeng, el multimillonario fundador de este modelo de inteligencia artificial, asegura haber usado entre 10.000 y 50.000 GPUs de la compañía norteamericana, logrando reducir notablemente sus costes.
Mientras que el token –la unidad más pequeña de medida de estos modelos– de GPT se queda en 15 dólares, el de DeepSeek apenas pasa de los 50 centavos –en la misma divisa–, disponible para los negocios que quieran ahorrar bastante dinero en su implementación.
No obstante, las críticas contra este modelo no se han hecho esperar, desde los problemas relacionados con el código abierto hasta el almacenamiento de los datos en servidores de China. Te explico por qué no deberías tener miedo de esto y cómo usar DeepSeek de forma segura y privada.
Por qué es una gran noticia que DeepSeek sea de código abierto
Entre tanto revuelo, algunas declaraciones importantes han pasado algo desapercibidas, como la que expresó en LinkedIn Yann LeCun, científico jefe de inteligencia artificial en Facebook. Para él, DeepSeek no demuestra la supremacía de China respecto a Estados Unidos en este campo.
Más bien, la lectura correcta sería que "los modelos de código abierto están superando a los propietarios", algo en lo que se ha apoyado la startup asiática para lanzar este modelo. "Ese es el poder de la investigación abierta y el código abierto", agregó.
Como expresa de forma precisa LeCun, esta es la principal ventaja de usar modelos open source, aunque según las pruebas realizadas podría ser que el código fuente de DeepSeek sea propietario, al menos tras las consultas a este chatbot.
Aunque puedes revisar su código en GitHub, tanto de DeepSeek R1 como de DeepSeek V3, algunos repositorios podrían contener ejecutables con código malicioso, a pesar de que una gran comunidad se dedica a revisar los potenciales problemas relacionados con esto.
En tal caso, ChatGPT recomienda no confiar ciegamente en trust_remote_code=True o si existen archivos en el repositorio como setup.py, install.py o cualquier otro script de instalación. Adicionalmente, a la fecha de este artículo, DeepSeek muestra el prompt interno.
Es decir, que ofrece un error de conexión con el servidor, junto a las indicaciones que se da a sí mismo el chatbot para responder al usuario final, algo de lo que avisa el mismo en el repositorio de GitHub.
Para evitar el riesgo evidente en seguridad, lo mejor es configurar un modelo más ligero desde una máquina virtual o con Ollama.
Si quieres optar por un entorno controlado para su uso, usa una máquina virtual como VMWare o VirtualBox; así, si ejecutas código malicioso, el host, tu dispositivo físico, no quedará afectado.
Si prefieres utilizar Ollama, puedes aprender cómo configurar correctamente DeepSeek.
Sea como sea, durante los análisis realizados a DeepSeek no se ha encontrado actividad sospechosa en diferentes herramientas. Así que, por lo general, no tendrías que preocuparte. De cualquier forma, revisa siempre los comentarios de la comunidad, por si hubiera algún problema detectado.

