Microsoft lanza sus modelos de IA propios MAI-1-preview y MAI-Voice-1 para competir con ChatGPT e independizarse de OpenAI

El objetivo de Microsoft a medio plazo es usar su propia inteligencia artificial, y ya ha comenzado a hacerlo, con el estreno de MAI-1-preview y MAI-1-Voice. Te cuento cómo probarlos.
La relación entre Microsoft y OpenAI no va bien, y comenzamos a ver por qué. El objetivo de la compañía de Satya Nadella es pasar de aliado patrocinador a competencia de OpenAI, con sus modelos de lenguaje propios. Ya los tenemos aquí: MAI-1-preview y MAI-1-Voice.
MAI es un acrónimo de Microsoft AI, por eso su primer LLM o modelo de lenguaje grande propio, se llama MAI-1. Se estrena en dos variantes. MAI-1-Voice y MAI-1-preview. Son nombres muy lógicos, los que usaría un programador, pero el departamento de marketing debía estar de vacaciones cuando los eligieron.
MAI-1 va a competir directamente con ChatGPT, Gemini y compañía. Esta primera versión seguramente esté lejos de ellos, pero el hecho de que Microsoft haya decidido hacerla pública, indica que ya está lo suficientemente madura para dejar que los usuarios la prueben.
Qué son MAI-1-Voice y MAI-1-preview
Lo que recibimos hoy es una preview. Según explica Microsoft AI en la nota de prensa: "MAI-1-preview es un modelo interno que combina varios expertos, entrenado previamente y posteriormente en unas 15.000 GPU NVIDIA H100".
Y continúa: "Este modelo está diseñado para proporcionar potentes capacidades a los consumidores que desean beneficiarse de modelos especializados en seguir instrucciones y proporcionar respuestas útiles a consultas cotidianas". Vamos, la competencia de ChatGPT.
MAI-1-preview se va a integrar en algunos casos de respuestas con texto en Copilot en las próximas semanas, con el fin de aprender y mejorar a partir de los comentarios de los usuarios, según Microsoft. Se puede probar también en LMArena.
MAI-1-Voice es una variante especializada en la generación de voz. Es "altamente expresivo y natural", y ya está disponible en Copilot Daily y Podcasts. También como una nueva experiencia de Copilot Labs. Puedes probarlo aquí.
"La voz es la interfaz del futuro para los compañeros de IA, y MAI-Voice-1 ofrece un audio expresivo y de alta fidelidad tanto en escenarios con un solo locutor como con varios", dice el comunicado.
Es capaz de generar un minuto de audio en solo un segundo, usando una única GPU. Simplemente le dices algo como "una historia sobre dinosaurios", y en un segundo crea un cuento de un minuto con diferentes tipos de voces. Lo he probado, y lo cierto es que suena muy natural. Solo en inglés, eso sí.
Microsoft asegura que "seguiremos utilizando los mejores modelos de nuestro equipo, nuestros socios y las últimas innovaciones de la comunidad de código abierto para impulsar nuestros productos".
De momento no van a renunciar a GPT, pero cada vez es más obvio que la asociación con OpenAI es solo temporal. Microsoft busca la independencia para competir con GPT, Gemini y compañía con sus modelos de lenguaje MAI. MAI-1 es solo el principio.
