Google acaba de lanzar una IA que traduce en tiempo real y copia hasta tu forma de hablar

Google lanza Gemini 3.5 Live Translate, una IA que traduce voz en tiempo real en más de 70 idiomas con mayor naturalidad y menor latencia.
Google ha presentado Gemini 3.5 Live Translate, un nuevo sistema de inteligencia artificial diseñado para traducir voz en tiempo real con una naturalidad muy superior a las soluciones actuales.
A diferencia de los traductores tradicionales que esperan a que el interlocutor termine de hablar, este modelo es capaz de procesar el audio de forma continua, generando traducciones casi en paralelo y reduciendo al mínimo las pausas, lo que permite conversaciones mucho más fluidas entre personas que hablan distintos idiomas.
La principal novedad de este sistema es su capacidad para reproducir no solo el contenido del mensaje, sino también elementos como el tono, la entonación y el ritmo del hablante. Según Google, Gemini 3.5 Live Translate puede detectar automáticamente más de 70 idiomas y mantener una voz traducida que conserva parte de la expresividad original, acercándose más a una conversación humana natural que a una traducción robótica.
Este avance se apoya en una arquitectura de procesamiento en streaming, lo que significa que la IA analiza el habla mientras se produce, sin necesidad de esperar bloques completos de frases. Esto reduce la latencia y mejora la experiencia en entornos donde la comunicación en tiempo real es clave, como reuniones, llamadas internacionales, clases o incluso servicios de atención al cliente.
Google planea desplegar esta tecnología en varios frentes. Por un lado, estará disponible para desarrolladores a través de la Gemini Live API y Google AI Studio, lo que permitirá integrar la traducción en tiempo real en aplicaciones de terceros. Por otro, llegará a entornos empresariales mediante Google Meet, donde se probará en reuniones multilingües con usuarios de Google Workspace. Finalmente, también se integrará en la app del Traductor de Google en Android e iOS para uso general.
En Google Meet, esta tecnología permitirá conversaciones entre más de 70 idiomas y más de 2000 combinaciones lingüísticas, ampliando de forma significativa las capacidades actuales de traducción dentro de videollamadas. La interfaz también se actualizará para facilitar el acceso inmediato a la traducción de voz durante las reuniones.
En la aplicación del Traductor de Google, los usuarios podrán activar la función de traducción en vivo simplemente conectando auriculares, permitiendo escuchar la traducción manteniendo el tono del hablante original. En Android, además, se está probando un modo de escucha que reproduce la traducción directamente por el altavoz del teléfono, simulando una llamada tradicional.
Con esta novedad se acerca cada vez más la interacción entre idiomas distintos a una conversación completamente natural.