La IA de Google ya tiene 'ojos': Gemini ya puede ver tu pantalla y tus pestañas

Varios usuarios han conseguido acceder a lo nuevo de Gemini, el asistente de Google, que ya permite interactuar en tiempo real con el usuario mediante la voz. Ahora, la IA es capaz de reconocer en tiempo real tu pantalla.
Gemini ya puede saberlo todo sobre ti, gracias a una nueva función experimental que Google está probando en dispositivos seleccionados.
Ahora, gracias al conocido como Proyecto Astra de la multinacional tecnológica, Gemini puede acceder a tu pantalla en tiempo real, ya sea a una aplicación concreta o a todos los sitios donde navegues, para integrarse totalmente como un asistente de inteligencia artificial.
Así lo ha compartido en Reddit un usuario, que ha mostrado una captura de pantalla en la que se pueden apreciar 2 nuevos botones, como son "Compartir pantalla con Live" y "Preguntar sobre esta pantalla".
Al parecer, según los comentarios de diferentes usuarios a la publicación de Reddit, esto solo está disponible en fase de pruebas para los que hayan adquirido el plan Gemini Advanced o cuenten con una cuenta de Google One, al menos en Estados Unidos.
Es un gran cambio que supone el próximo paso de los asistentes impulsados por IA, ya que hasta ahora Gemini solo era capaz de reconocer capturas estáticas de una imagen; con esta novedad, ya nada se le resiste y puede comprender todo lo que vea.
Sin embargo, no es un cambio exclusivo del asistente de IA de Google, ya que Microsoft hizo lo propio a finales del año pasado con Copilot Vision, permitiendo que este copiloto inteligente pueda obtener información en directo, aunque solo de momento en Microsoft Edge.
En lo que concierne a Google, como se puede ver en la demostración de Gemini Vision en el hilo de Reddit, el asistente interactúa en tiempo real con el usuario y permite responder cualquier cuestión sobre lo que se visualiza en pantalla.
Aunque Google no ha reconocido oficialmente qué funcionalidades acabarán llegando ni cuándo será la fecha del despliegue, el usuario ha recabado todo lo que puede hacer según los cambios experimentales.
Así, el usuario en cuestión ha podido acceder a estas mediante un móvil de Xiaomi, a pesar de que siempre las novedades llegan primero a dispositivos Galaxy de Samsung o a los Pixel de Google. A ello se suma que no todos los usuarios pueden acceder a estas y parece más bien un error de lanzamiento de Google.
Curiosamente, ahora Gemini se quedará esperando también una pregunta o comando si no escucha nada al otro lado, a diferencia de lo que ocurría antes, a lo que respondía con un tímido "lo siento, no he entendido lo que me pides".
A día de hoy, puedes comprobar si tienes acceso a estas funciones desde las opciones de desarrollador o mediante tus perfiles de Gemini Advanced o Google One, según lo publicado en el mismo hilo.
