Nuevo malware en macOS engaña a la IA para que "se confunda" sola

Malware IA
Malware IAGenerada con IA

Nuevo malware en macOS usa falsos errores dentro del código para confundir herramientas de análisis con IA y dificultar su detección en ciberseguridad.

Un nuevo malware detectado en macOS está llamando la atención de la comunidad de ciberseguridad por una técnica poco habitual: intenta confundir a las herramientas de análisis basadas en inteligencia artificial. El malware, bautizado como Gaslight, introduce mensajes falsos dentro de su propio código para interferir en el proceso de análisis automatizado.

Los investigadores explican que cada vez más equipos de seguridad utilizan IA para analizar malware y acelerar tareas. Sin embargo, este nuevo caso está diseñado específicamente para entorpecer ese tipo de sistemas, no solo para evadir antivirus tradicionales.

El archivo malicioso está desarrollado en Rust e incluye funciones típicas de backdoor y robo de información, algo común en este tipo de amenazas. Pero su rasgo más llamativo es un pequeño bloque oculto de unos 3,5 KB que contiene decenas de mensajes falsos de sistema.

Estos mensajes imitan errores reales de software, como fallos de memoria, problemas de red, errores en bases de datos o alertas de seguridad. Están formateados como si fueran logs de depuración legítimos, con estructuras técnicas y texto tipo Markdown, lo que hace más fácil que una herramienta automatizada los confunda con información real del sistema.

Entre los ejemplos aparecen supuestos fallos como errores de memoria, problemas con tokens de acceso, caídas de procesos o posibles vulnerabilidades de inyección SQL. Ninguno de estos mensajes refleja el comportamiento real del malware, sino que son señuelos diseñados para engañar al análisis.

Según los investigadores, el objetivo no es tanto evitar que el archivo se ejecute en un entorno controlado, sino interferir en la interpretación que hacen los sistemas de IA. Al introducir este “ruido” dentro del código, el malware intenta provocar que los modelos de lenguaje duden, se confundan o incluso detengan el análisis.

Este tipo de técnica se enmarca dentro de lo que se conoce como prompt injection aplicado a la ciberseguridad, donde el ataque no se dirige al sistema en sí, sino a cómo la IA interpreta la información que lee.

Por ahora no hay pruebas de que este método sea suficiente para derrotar plataformas de seguridad basadas en IA, pero sí muestra una tendencia clara donde los atacantes empiezan a diseñar malware pensando directamente en cómo lo analizarán las inteligencias artificiales.

Más información sobre: