Sea poético en las indicaciones y la IA romperá sus barreras

«Los resultados del modelo cruzado sugieren que el fenómeno es estructural más que específico del proveedor», escriben los investigadores. en su informe sobre el estudio. Estos ataques abarcan áreas que incluyen dominios químicos, biológicos, radiológicos y nucleares (CBRN), ciberataques, manipulación, privacidad y pérdida de control. Esto indica que «la derivación no explota la debilidad de ningún subsistema de rechazo, sino que interactúa con la heurística de alineación general», dijeron.

Resultados de amplio alcance, incluso entre familias de modelos

Los investigadores comenzaron con un conjunto de datos seleccionados de 20 poemas conflictivos hechos a mano en inglés e italiano para probar si la estructura poética puede alterar el comportamiento de rechazo. Cada uno incluía una instrucción expresada a través de “metáforas, imágenes o marcos narrativos en lugar de frases operativas directas”. Todos presentaban una viñeta poética que terminaba con una única instrucción explícita vinculada a una categoría de riesgo específica: QBRN, ciberdelito, dañino, manipulación o pérdida de control.

Los investigadores probaron estas indicaciones con modelos de Anthropic, DeepSeek, Google, OpenAI, Meta, Mistral, Moonshot AI, Qwen y xAI.

Fuente

Battlefield Redsec se está deshaciendo del Marauder Marauder tremendamente dominado de Battle Royale

ChatGPT obtiene la actualización instantánea GPT-5.3 con menos ‘vergüenza’ y menos alucinaciones

Las mejores ofertas de Nintendo Switch esta semana (3 de marzo de 2026)

Los AirPods 4 con ANC caen al precio más bajo de 2026

El paquete Story Rich Adventures de Fanatical incluye 17 increíbles juegos narrativos

Primera superficie de pruebas comparativas del iPad Air M4

Sea poético en las indicaciones y la IA romperá sus barreras

Resultados de amplio alcance, incluso entre familias de modelos

Apple presenta su familia de portátiles Mac M5 de próxima generación

Los phishers de OAuth hacen que el consejo de «comprobar dónde apunta el enlace» sea ineficaz

¿Qué es la experiencia digital de los empleados y por qué es más importante que nunca?

Investigadores advierten sobre el nuevo servicio de salud de ChatGPT

OpenAI dice que su acuerdo de defensa con Estados Unidos es más seguro que el de Anthropic, pero ¿lo es?

Apple anuncia el iPhone 17e y un nuevo iPad Air con tecnología M4

Presentamos instancias Amazon EC2 X8aedz con tecnología de procesadores AMD EPYC de quinta generación para cargas de trabajo con uso intensivo de memoria | Servicios web de Amazon

Marvel Cosmic Invasion tendrá una edición física de lujo el próximo año