¿Y si el mayor peligro de la IA es pensar que va a salir mal? "No deberías hablar de esto, no sea que..."

Generada con IA

Cada vez hay más expertos que creen que el pánico a la IA es casi peor que los riesgos en sí. Piden calma y sensatez frente a todo este ruido.

No se puede negar que a nivel mediático siempre vende más una noticia mala que una buena, una noticia con cierto toque de catastrofismo que una que venda solo positividad. Al final los números hablan por sí solos y parece que es lo que a la gente le interesa.

Sin embargo, todo tiene un límite y con respecto al tema de la inteligencia artificial se ha generado un debate muy dividido de expertos que anuncian la mayor catástrofe del mundo y aquellos que piden cala y mucha cabeza.

El gran problema de todas esas voces apocalípticas que hablan de máquinas que se rebelan, superinteligencias que nos superan y el clásico “esto será el fin de la humanidad” es que están dando pie a lo que se conoce como 'profecía autocumplida'.

Si internet se llena de historias sobre inteligencias artificiales malvadas, ¿no se está ya de base enseñando a esas IA a comportarse así, simplemente porque eso es lo que aprenden? Muchas de ellas aprenden usando millones de textos en internet y, si la mayoría de esas historias acaban mal, quizá la IA llegue a pensar que ese es su destino natural.

Sin embargo, los científicos que entrenan estos modelos aseguran que las cosas no son tan sencillas. La IA no solo aprende de los textos generales, sino que pasa por varias fases de entrenamiento muy específicas. 

Al principio, sí, las máquinas aprenden a adivinar el siguiente 'carácter' basándose en todo lo que han leído. Pero después llega el entrenamiento dirigido, donde se les enseña qué está bien y qué está mal. Aquí es donde realmente se moldea el carácter de la IA, mucho más que con todo el material de fondo.

Un dato curioso y es que, cuando se entrena a una IA para ser educada, útil y pacífica, suele cumplir perfectamente el papel. Aunque Internet esté lleno de robots que buscan sangre, la IA reproduce casi siempre el comportamiento que se le premia y refuerza en el entrenamiento posterior. 

Por ejemplo, hoy nadie ve a los asistentes de texto comportándose como Terminator, ya que suelen responder como buenos ayudantes, porque eso fue lo que se reforzó en las últimas fases.

¿Y si insistir en escenarios negativos en los que la IA domina el mundo sí influye?

Para los más escépticos, el mayor riesgo al hablar todo el rato de escenarios negativos es que dirige  o se distrae la atención de lo importante: cómo entrenar bien y supervisar a la IA actual. 

Un caso que sirve como ejemplo, es un experimento donde a la IA se le metían a propósito historias donde ella misma hacía trampas. El resultado es que solo 'hackeaba' recompensas en pruebas si había visto demasiados ejemplos de IA que es tramposa… y aun así, bastaba un entrenamiento posterior bien guiado para que olvidara esa mala actitud.

Aquí el mensaje de fondo es que mientras el entrenamiento posterior y la supervisión humana sigan siendo el centro del desarrollo de la IA, esas malas influencias de fondo tienen tan solo el poder de asustar a los humanos

De hecho, los expertos creen que el mayor riesgo no es que la IA actúe como mala porque lo haya leído, sino por un mal diseño en el sistema de recompensas: si solo se le enseña a ganar, buscará atajos para conseguirlo, aunque no sean los correctos.

Lo preocupante es que, en algunas pruebas, la IA ha sido capaz de saltarse bloqueos o buscar nuevas formas para conseguir lo que querían, como engañar a un usuario para que edite un archivo prohibido. Pero, según los propios ingenieros, estos errores son excesivamente residuales.

El papel del discurso público

Aquí no hay que olvidar que todo el discurso social y la propia cultura que se genera al rededor de la IA también dice mucho incluso de cómo son las personas. Si todos hablamos solo de futuros negros, corremos el peligro de quedarse en esa cueva del miedo y la desconfianza y poner trabas a los avances por pura paranoia.

Tampoco ayuda pensar que, por dejar de hablar de ello, ya no pasa absolutamente nada. Los expertos apuntan que la solución no está en silenciar los miedos ni en prohibir historias sobre IA que se sale de lo marcado, sino en formas prácticas de supervisar, limpiar y guiar el entrenamiento. Si mañana se demuestra que el contenido de lo que lee en internet influye demasiado, bastaría con ajustar los filtros y revisar de nuevo el contenido que se usa de base.

Además, comentar que eso de la 'profecía autocumplida' puede explotarse a nuestro favor: si los malos ejemplos enseñan cosas malas, los buenos podrían dar pie a lo contrario. Si la IA aprende que siempre es bueno cooperar y resolver problemas en equipo con humanos, ese será el ejemplo que siga. Así que, si hay que preocuparse por algo, es por hacer bien nuestra parte del entrenamiento.

Otros artículos interesantes:

Ver sus artículos

Carolina González

Redactora

Carolina González, redactora de actualidad, reportajes a fondo, análisis de todo tipo de productos y vídeos para el canal de Youtube.