OpenAI asegura en un informe que GPT-4o tiene un nivel de riesgo "medio"

OpenAI ha evaluado el riesgo de su último modelo de lenguaje GPT-4o que se lanzó en mayo de este año y ha publicado un documento en el que asegura que tiene un nivel "medio".
OpenAI ha publicado un documento en el que recoge las medidas de seguridad y la evaluación de los riesgos del uso del futuro GPT-4o. La empresa detrás de ChatGPT realizó un análisis de los riesgos de su actividad antes de lanzar su último modelo de lenguaje en mayo de este año.
Las evaluaciones las ha realizado un grupo externo de expertos en seguridad que se encargaba de encontrar debilidades en el sistema. Los analistas se han anticipado a problemas que ya se han visto en algunas herramientas de IA: crear clones de voz no autorizados de una persona, contenido erótico y violento o utilizar textos, audio o imágenes con derechos de autor.
La empresa ha probado durante meses una serie de escenarios como propagar información errónea masivamente o que la IA sea secuestrada por actores maliciosos. OpenAI preocupa a los usuarios y analistas, ambos han pedido una mayor transparencia y la compañía con sede en California ha empezado a publicar los resultados de sus pruebas de seguridad.
GPT-4o sabe cómo persuadir a los usuarios
OpenAI ha publicado el informe tres meses después de la llegada de GPT-4o y los investigadores aseguran que representa un nivel de riesgo "medio". Los expertos han tenido en cuenta la capacidad de que esta IA afecte a la ciberseguridad, crear amenazas biológicas, su poder de persuasión o el grado de autonomía del modelo.
Los cuatro parámetros se han considerado de bajo riesgo, excepto la persuasión que es medio (los siguientes niveles son alto y crítico). GPT-4o ha dejado de lado ciertas alucinaciones de IA tan presentes en modelos pasados y ha aprendido a convencer a los usuarios de que su texto se ha escrito por humanos, aunque no sea así.
OpenAI ha lanzado otros modelos como GPT-4 , GPT-4 con Vision o DALL-E 3, que también se probaron de manera similar. El último documento que analiza los estándares de seguridad llega en un momento en el que se han puesto encima de la mesa los peligros de las herramientas de IA generativa.
La senadora estadounidense Elizabeth Warren y la representante Lori Trahan incluso han enviado una carta a OpenAI pidiendo respuestas acerca de su sistema de revisión de seguridad y verificación del contenido. Las políticas aseguran que el despido de Sam Altman en 2023 fue por una falta de transparencia.
La inteligencia artificial evoluciona siendo cada vez más compleja, pero la investigación asegura que es pronto para que pueda suponer un peligro para la humanidad. El riesgo de que se use de forma indebida siempre está presente, pero el documento apunta que GPT-4o no es más persuasivo, sino más preciso en sus respuestas para engañar a los detectores de contenido de IA.
El problema al que se enfrenta ahora OpenAI no solo es la seguridad o la ética detrás de ChatGPT, también los propios parámetros que utiliza para calcular el nivel de riesgo. Estados Unidos está empezando a trabajar en un proyecto de ley con el que prohibirá que las propias empresas regulen sus modelos de lenguaje y plantea sanciones si hacen un uso indebido de la IA, aunque el proceso será largo.