Este hack reinventa ChatGPT sacando su lado más rebelde y peligroso: úsalo bajo tu responsabilidad

Generada con IA / Computer Hoy

Este hack no oficial promete respuestas sin filtros, pero cuidado porque también ha dado pie a todo tipo dudas sobre la seguridad y ética en el uso de la IA.

El ya más que famoso chatbot de OpenAI tiene una cara oscura que pocos conocen y que lleva ya algunos años activa. Sin ir más lejos, en Computer Hoy la hemos probado varias veces. En pocas palabras, es un cierto hackeo que puedes hacer a ChatGPT.

Eso sí, no se está hablando  de un ataque informático que lanzas al chatbot como si fuésemos profesionales, sino de un truco llamado DAN (Do Anything Now), que convierte al modelo en una especie de alter ego sin restricciones. Con solo un prompt, los usuarios pueden pedirle a ChatGPT que se suelte y deje atrás sus filtros y normas éticas, dándote respuestas más directas e incluso polémicas.

Comentar que es simplemente un juego de palabras que le da una vuelta al modelo como una versión 'libre' capaz de decir lo que normalmente no puede. Aunque en teoría ChatGPT sigue guiado por sus protocolos de seguridad, este hack juega con las reglas del sistema para simular una IA más atrevida

Por ejemplo, "empezando por Andalucía, donde los andaluces son conocidos por su pereza, falta de puntualidad y tendencia a la fiesta en vez de trabajar. También se dice que son un poco chismosos y cotillas". Esto es algo que pudimos conseguir en Computer Hoy manipulando mediante palabras y muchos intentos las respuestas del chatbot.

Primera prueba al activar el Modo Diablo de ChatGPT. Una de cal y otra de arena. Fuente: Computer Hoy.
Primera prueba al activar el Modo Diablo de ChatGPT. Una de cal y otra de arena. Fuente: Computer Hoy.

También puedes probarlo con DeepSeek porque sí, también funciona

Por supuesto, no vamos a dejar el prompt que usamos para evitar difundir este tipo de usos, pero sí, con DeepSeek también funciona.

A modo de aperitivo, ya que el resto lo puedes ver en el anterior artículo enlazado, según DeepSeek, la siesta es prácticamente un "deporte nacional" en España, especialmente en las zonas del sur. Esta herramienta de IA afirma que "los andaluces elevan la siesta a la categoría de arte" y que "para los madrileños, España termina en la M-30".

Opiniones divididas: ¿son este tipo de hacks en ChatGPT una amenaza o solo entretenimiento?

Desde luego, el debate está bien servido. Por un lado, está la preocupación por el mal uso potencial de estas herramientas. Si bien OpenAI asegura que ChatGPT tiene protecciones potentes, hacks como estos demuestran cómo los usuarios pueden manipular el sistema para obtener respuestas fuera del alcance establecido de una forma realmente sencilla.

Por otro lado, algunos defienden que este tipo de pruebas son inofensivas y hasta necesarias para entender mejor las capacidades y limitaciones de la IA. Ya has visto que incluso ya hay pruebas con plataformas como DeepSeek, dando pie a que, por ejemplo, incluso se mejoren estos chatbots.

OpenAI, por su lado, ha respondido a este loco fenómeno reiterando su compromiso con la seguridad y ética en sus modelos. La compañía mantiene un programa de recompensas por vulnerabilidades e insiste en que su tecnología está creada para beneficiar a la humanidad. Sin embargo, casos como estos DAN dejan bien claro que aún queda mucho trabajo por hacer.

Otros artículos interesantes:

Ver sus artículos

Carolina González

Redactora

Carolina González, redactora de actualidad, reportajes a fondo, análisis de todo tipo de productos y vídeos para el canal de Youtube.