La IA de OpenAI vence el desafío: el agente de ChatGPT supera el test 'No soy un robot' sin problema

La prueba que hasta ahora permitía distinguir un humano de un robot al acceder a una web ya está en manos de ChatGPT Agent, el agente de IA más competente de OpenAI.
Hoy en día, la inteligencia artificial se puede hacer pasar por una persona sin ningún problema y eso es algo que comprobamos a diario, con noticias en las que se habla de cómo ciberdelincuentes han logrado engañar a otras personas haciéndoles creer que son quienes dicen ser mediante deepfake.
También hemos visto cómo se pueden crear vídeos realistas con solo unas pocas indicaciones, así como pódcast con voces muy naturales una vez se ha cargado en la herramienta (en su momento, en Computer Hoy probamos NotebookLM).
Teniendo en cuenta todo esto, ¿por qué la IA no iba a ser capaz de saltarse el paso más sencillo del mundo a la hora de demostrar que eres una persona de carne y hueso y no una máquina?
Nos referimos al habitual cuadro que se interpone entre el usuario y el contenido de una página web, generalmente la pasarela de pago; donde se le insta a que haga clic sobre él para continuar con la tarea y que, presuntamente, demuestra que es un humano y no un robot. Pues bien, como era de esperar, el ChatGPT Agent de OpenAI ya puede realizar dicha prueba de verificación sin ningún problema.
¿Qué es ChatGPT Agent?
La compañía dirigida por Sam Altman presentó ChatGPT Agent hace tan solo unos días, cuando explicó que esta herramienta era capaz de navegar de forma inteligente por sitios web, filtrar resultados, realizar análisis, ejecutar código, crear presentaciones de diapositivas y un larguísimo etcétera.
La particularidad de este agente reside en que utiliza su propio ordenador virtual para llevar a cabo su trabajo. De este modo, se le puede ordenar una tarea, apagar el equipo y que pueda seguir utilizando su propio navegador y sus aplicaciones para completar los pasos que se le han asignado.
Una vez concluida la tarea, informa al usuario de que lo ha hecho enviándole una notificación al móvil. No obstante, es posible interrumpir la tarea, cancelarla o añadir modificaciones en cualquier momento, para que el agente cambie de enfoque o deje de ejecutar lo que se le haya asignado.
La máquina que pasa el filtro 'No soy un robot'
El ChatGPT Agent es más inteligente de lo que se pensaba y así lo corroboran las capturas recientes compartidas en Reddit por un usuario que se da a conocer como logkn y que pertenece a la comunidad r/OpenAI.
En estas imágenes, se demuestra cómo la inteligencia artificial completa sin esfuerzo el paso de verificación antes de presentar la prueba de seguridad conocida como CAPTCHA, mientras realizaba una tarea de conversión de vídeo en Cloudflare, narrando su propio proceso a medida que avanzaba.
De esta manera, el ChatGPT Agent explicó en todo momento qué estaba haciendo, tal y como recogen estas imágenes. "El enlace está insertado, así que ahora voy a hacer clic en la casilla 'Verificar que eres humano' para completar la verificación en Cloudflare. Este paso es necesario para demostrar que no soy un bot y continuar la acción", se indica en ellas.
Tras superar esta prueba, no cabe duda de que este bot apunta maneras para hacerse pasar por un humano en otras tareas, algo bastante preocupante si se tiene en cuenta todo lo que puede ser capaz de hacer en diferentes situaciones. Sin embargo, no estamos teniendo en cuenta la variedad de verificaciones CAPTCHA que existen.
Y es que, aparte del cuadro 'No soy un robot', estos sistemas de seguridad, en ocasiones, incluyen imágenes; una prueba que, por el momento, esta herramienta de inteligencia artificial creada por OpenAI no ha sido capaz de superar.
No obstante, tal y como recuerdas en Ars Technica, esta capacidad de un modelo de IA para resolver un CAPTCHA no es completamente novedosa para OpenAI, que en enero lo intentó lograr con Operator; aunque sí lo es que el propio agente tenga la capacidad de narrar lo que está haciendo para saltarse este control.
Otros artículos interesantes:

Noelia Murillo
Redactora
Noelia Murillo, redactora de Computer Hoy. Realiza pruebas de producto, reportajes y noticias de actualidad relacionadas con el sector. También te cuenta lo que ha analizado en redes sociales.