Microsoft patenta una tecnología basada en IA que genera imágenes en vivo mientras hablas

Generada con IA

Nunca las reuniones por Internet serán aburridas gracias a este invento patentado por Microsoft para que veamos un montón de imágenes generadas en tiempo real.

Todos sabemos que Microsoft está apostando bastante fuerte en el terreno de la inteligencia artificial, ya lo hemos visto con la presencia de Copilot en prácticamente cualquier programa y en su sistema operativo, y ahora quieren atajar el tema de la generación de imágenes.

No obstante, la propia Copilot, basándose en Microsoft Designer, ya puede crearnos multitud de imágenes con las instrucciones adecuadas, pero gracias a una patente descubierta parece que Microsoft quiere ir mucho más lejos al respecto.

Según la patente registrada en la Oficina de Marcas y Patentes de Estados Unidos, este documento habla sobre un sistema impulsado por inteligencia artificial para convertir audio en vivo en imágenes.

Es decir, se trata de un sistema que sería capaz de ir creando imágenes en tiempo real, mientras, por ejemplo, se produce una reunión en Microsoft Teams o en programas similares.

Durante la reunión, a medida que los usuarios hablan, estas palabras serían captadas por un micrófono y luego convertidas en una transcripción de texto.

Después, la transcripción de texto se segmentaría en frases y cada segmento se resumiría utilizando un modelo de lenguaje para generar indicaciones para la generación de las imágenes.

De esta forma, según el tema que se esté tratando, los usuarios también tendrían imágenes generadas con estas instrucciones para que puedan seguir la reunión de mejor forma.

“Cuando se utilizan imágenes para complementar la comunicación verbal, pueden ayudar a aclarar conceptos y hacerlos más fáciles de entender, lo que puede ser especialmente beneficioso para las personas que aprenden mejor a través de ayudas visuales”, dice Microsoft al describir la idea detrás de esta tecnología.

Sería una característica ideal para Microsoft Teams, dado que estas imágenes generadas por inteligencia artificial, se mostrarían en la pantalla en vivo mientras continúa el audio.

Otros artículos interesantes: