Nvidia, a la conquista de Europa: lanza un conjunto masivo de datos y herramientas preparados para la IA

Generada con IA

Nvidia ha lanzado Granary, una reunión de datos utilizado para entrenar modelos de IA para la transcripción de voz multilingüe para 25 idiomas europeos.

Nvidia se encuentra en una delicadísima situación provocada por el conflicto entre Estados Unidos y China, que la han llevado al borde del abismo en más de una ocasión y que parece no tener fin, a pesar de que la Administración Trump ya le ha dado luz verde y permiso para volver a poner en circulación los chips H20.

La respuesta del Gobierno de Xi Jinping, en cambio, no fue la esperada, ya que rápidamente decidió bloquear la entrada de estos productos en el país, asegurando que podrían integrar tecnologías de espionaje, así como puertas traseras, interruptores de seguridad y otro tipo de malware, lo que Nvidia rápidamente negó.

Si bien poco después avanzó que estaba trabajando en "una variedad de productos" para hacer frente a estos problemas en China, fuentes de este país ya habían indicado que priorizarían productos nacionales frente a los extranjeros, una medida que probablemente impulsará a la competidora Huawei.

Esta inestabilidad ha llevado a Nvidia a pensar en un plan B y, en lugar de mirar hacia Asia, ha optado a centrar el foco en Occidente y, más concretamente, en los países de Europa. Así, ha lanzado un nuevo conjunto de datos y modelos que respaldan el desarrollo de la IA de reconocimiento de voz y traducción de alta calidad para 25 idiomas europeos.

Tecnología para chatbots multilingües y servicios de traducción simultánea

La tecnológica dirigida por Jensen Huang ha querido abordar un problema importante relacionado con la capacidad de la inteligencia artificial, ya que "de los aproximadamente 7.000 idiomas que existen en el mundo, solo una pequeña fracción cuenta con el respaldo de modelos lingüísticos" impulsados por esta tecnología.

Al poner a disposición de los usuarios estas herramientas de libre uso, por tanto, espera que los desarrolladores puedan "escalar con mayor facilidad las aplicaciones de IA para brindar soporte a usuarios globales" con tecnologías dirigidas a plataformas como chatbots, agentes de voz de atención al cliente y servicios de traducción en tiempo real.

Granary, por su parte, contiene alrededor de un millón de horas de audio, incluidas casi 650.000 horas para el reconocimiento de voz y más de 350.000 para la traducción. Con estos datos, los desarrolladores podrán construir modelos que aborden tareas de transcripción y traducción en casi todos los 24 idiomas oficiales de la Unión Europea, además del ucraniano y el ruso. 

Asimismo, Nvidia Canary -1b-v2 es un modelo de mil millones de parámetros entrenado en Granary para la transcripción de alta calidad de idiomas europeos, además de la traducción entre inglés y dos docenas de idiomas compatibles.

Este modelo está disponible bajo una licencia permisiva y amplía los idiomas admitidos por la familia Canary de cuatro a 25. Asimismo, según sus datos, es capaz de ofrecer una calidad de transcripción y traducción comparable a modelos tres veces más grandes y ejecuta la inferencia a una velocidad 10 veces mayor.

Nvidia Parakeet-tdt-0.6b-v3, por otro lado, contiene 600 millones de parámetros y está diseñado para la transcripción en tiempo real o de grandes volúmenes de los idiomas compatibles con Granary, según ha explicado en un comunicado oficial.

En él también ha matizado que este modelo prioriza el alto rendimiento y es capaz de transcribir segmentos de audio de 24 minutos en una sola pasada de inferencia. Asimismo, detecta el idioma del audio de entrada de manera automática y lo transcribe sin necesidad de instrucciones adicionales.

Con todas estas novedades, para las cuales Nvidia ha colaborado con investigadores de la Universidad Carnegie Mellon de Pensilvania (Estados Unidos) y la Fondazione Bruno Kessler de Trento (Italia), la marca tecnológica ha querido demostrar que quiere abarcar tecnologías de procesamiento de voz más inclusivas y universales.

Otros artículos interesantes:

Más información sobre:

Ver sus artículos

Noelia Murillo

Redactora

Noelia Murillo, redactora de Computer Hoy. Realiza pruebas de producto, reportajes y noticias de actualidad relacionadas con el sector. También te cuenta lo que ha analizado en redes sociales.