Microsoft reinventa las reglas del juego: su IA ultraligera ya compite con DeepSeek y OpenAI usando solo tu CPU

Noticia

22 abr 2025 - 11:10

Microsoft acaba de poner en un serio apuro a gigantes como OpenAI y DeepSeek con un modelo de IA que cabe en un pendrive y funciona sin internet.

Microsoft de forma muy sibilina y sin que casi nadie se entere acaba de dar un gran golpe sobre la mesa desarrollando una inteligencia artificial que cabe en tu móvil, no necesita internet y gasta menos energía que una bombilla.

Con nombre BitNet, se trata de un modelo de lenguaje estilo GPT-4 que pone contra las cuerdas a gigantes como OpenAI y DeepSeek usando solo 400 MB de memoria. Mientras otros requieren superordenadores, este funciona hasta en el chip M2 de un MacBook Air. Y lo hace con un truco: en lugar de números complejos, usa -1, 0 y +1 para pensar.

El modelo, disponible gratis en GitHub, reúne lo que todo programador o fanático de esta tecnología sueña: ocupa poco, va rápido y no gasta batería. Con 2.000 millones de parámetros, compite con opciones más pesadas como el Llama 3 de Meta (2 GB) y supera al Gemma de Google en pruebas de razonamiento.

Microsoft lo ha entrenado con 4 billones de datos —equivalente a 33 millones de libros— para compensar su simplicidad. El resultado es absolutamente increíble, ya que responde preguntas, resuelve problemas y hasta escribe textos casi como los humanos.

¿Cómo un modelo de tres valores está cambiando las reglas? Microsoft saca pecho

La clave está en la cuantización terciaria, una técnica que simplifica por completo los cálculos. Mientras otros modelos usan hasta 32 decimales por operación, BitNet se queda con tres estados: negativo, cero y positivo. Esto reduce el "peso" de cada dato a 1,58 bits, frente a los 16 o 32 bits de la competencia. Según Microsoft, gasta hasta un 96% menos de energía que modelos parecidos.

Los números hablan por sí solos:

400 MB frente a 2 GB del Llama 3.
85-96% menos consumo que modelos FP16/FP32.
Velocidad 2-6 veces mayor en CPU como Intel Core o Apple M2.

Su secreto es el entrenamiento masivo: 4 billones de tokens le enseñaron a compensar la falta de precisión con volumen de datos. Ahora puede ejecutarse en cualquier CPU, sin GPU que cuesten un riñón.

BitNet vs. DeepSeek y OpenAI: la batalla de los pesos pesados

Desde luego el campo de batalla está que arde y hay grandes actores echando toda la carne en el asador para posicionarse en lo más alto de esta carrera tecnológica.

Sin ir más lejos, DeepSeek está reventando el mercado con sus modelos de código abierto y bajo coste. Su estrella, el DeepSeek-R1, compite con GPT-4 usando una arquitectura MoE (Mixture of Experts) que solo activa partes del modelo según la tarea.

Esto reduce costes y energía, como un motor híbrido que enciende cilindros según necesidad. Ya lo usan en hospitales chinos para analizar radiografías y en bancos para detectar fraudes en milisegundos.

DeepSeek se diferencia de otros modelos en su arquitectura y capacidad de razonamiento, pero también en el precio. China ha diseñado lo que se conoce como inteligencia artificial barata con una tasa de 0,14 dólares por millón de tokens. GPT-4o de OpenAI cobra 7,50 dólares por millón de tokens.

OpenAI, por su parte, apuesta por el razonamiento humano. Su modelo o1 —y el cancelado o3— dedicaban más tiempo a "pensar" antes de responder, perfecto para problemas complejos como ecuaciones o código. Pero ante la competencia china, unificará todo en GPT-5, eliminando modelos intermedios para simplificar. "Queremos que la IA simplemente funcione", dijo Sam Altman.

Microsoft juega en otra liga: su BitNet cabe en un pendrive y funciona sin GPU. Usa solo -1, 0 y +1 para procesar datos, como un semáforo que decide en lugar de calcular decimales. Consume 96% menos energía que modelos tradicionales y ya corre en CPU viejas. Dicho mal y pronto, es la IA para el pueblo: rápida, barata y offline.

¿Por qué DeepSeek asusta a Occidente?

La respuesta es porque ofrece GPT-4 gratis. Sus modelos, entrenados con 87% de código y 13% lenguaje natural, son caramelos para desarrolladores. El DeepSeek-Coder-V2 soporta 338 lenguajes de programación y un contexto de 128.000 tokens.

De nuevo comentar que OpenAI contraataca con integración y GPT-5 absorberá todas sus versiones anteriores, eliminando la confusión de elegir modelos. Aunque sacrifica especialización, gana en simplicidad.

Finalmente, parece que Microsoft no quiere pelear por la nube y BitNet es la navaja suiza de la IA local, por lo que queda claro que hay tres vertientes: DeepSeek dominando Asia y poniendo contra las cuerdas a EEUU, OpenAI liderando el razonamiento abstracto, aunque depende de costosas GPU y Microsoft democratizando el acceso con menos potencia pero muy buena calidad.

Al final, el usuario aquí es el que gana. Tienes opciones gratis con DeepSeek, muy potentes con OpenAI o accesibles con Microsoft.

Computer Hoy

Microsoft reinventa las reglas del juego: su IA ultraligera ya compite con DeepSeek y OpenAI usando solo tu CPU

¿Cómo un modelo de tres valores está cambiando las reglas? Microsoft saca pecho

BitNet vs. DeepSeek y OpenAI: la batalla de los pesos pesados

¿Por qué DeepSeek asusta a Occidente?

Otros artículos interesantes:

Más información sobre:

Carolina González