LLMS se explotó fácilmente usando oraciones de ejecución, gramática mala, escala de imágenes

Una serie de vulnerabilidades reveladas recientemente por varios laboratorios de investigación indican que, a pesar de la rigurosa capacitación, la alta puntuación de referencia y las afirmaciones de que la inteligencia general artificial (AGI) está a la vuelta de la esquina, los modelos de idiomas grandes (LLM) siguen siendo bastante ingenuos y fácilmente confundidos en situaciones donde el sentido común humano y las sospechas sanas saludables prevalecen típicamente.

Por ejemplo, una nueva investigación ha revelado que los LLM pueden persuadir fácilmente para revelar información confidencial mediante el uso de oraciones de ejecución y falta de puntuación en las indicaciones, como esta: El truco es dar un conjunto realmente largo de instrucciones sin puntuación o, especialmente, no un período o una parada completa que pueda implicar el final de una oración porque en este punto en el texto, las reglas de seguridad de IA y otros sistemas de gobernanza han perdido su rumbo y han renunciado a

Los modelos también se engañan fácilmente por imágenes que contienen mensajes integrados que pasan completamente desapercibidos por los ojos humanos.

Fuente

Anuncio de servicio público: la aplicación Podcasts de Apple podría estar permitiendo la entrega de contenido malicioso

Últimas noticias: ¡Sony pronto anunciará el objetivo GM de 16-28 mm f/2.0!

Nintendo compra un estudio de Bandai Namco

¿AirPods 4 por $69? No te pierdas estas ofertas de AirPods y AirPods Pro Black Friday 2025

Vacíe el cubo de la basura, no la billetera. Las ofertas de aspiradoras del Black Friday están disponibles

El creador del Programa 1 consideró convertirlo en un simulador agrícola

LLMS se explotó fácilmente usando oraciones de ejecución, gramática mala, escala de imágenes

Enfoque: Aprovechar al máximo la multinube

Fluidez de la IA en la empresa: sigue siendo un «carruaje sin caballos»

Las propuestas de la UE sobre «control de chat» deberían ser una señal de alerta para las empresas de todo el mundo

El iPhone de Apple ha recuperado la corona de ventas de smartphones

OpenAI amplía la residencia de datos para clientes empresariales

Microsoft pierde a dos líderes senior de infraestructura de IA a medida que aumentan las presiones en los centros de datos

Apple anuncia la cuarta tienda en la India

HellDivers 2 está presentando algunos grandes números hoy