in

Anthrope presenta un nuevo marco para bloquear el contenido dañino de los modelos de IA

Anthrope ha mostrado un nuevo marco de seguridad, diseñado para reducir el riesgo de contenido dañino generado por sus grandes modelos de idiomas (LLM), un movimiento que podría tener implicaciones de largo alcance para las empresas tecnológicas empresariales.

Los modelos de lenguaje grande se someten a una amplia capacitación en seguridad para evitar resultados dañinos, pero siguen siendo vulnerables a los jailbreaks: entradas diseñadas para evitar las barandillas de seguridad y provocar respuestas dañinas, dijo Anthrope en un comunicado.

Fuente

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

GIPHY App Key not set. Please check settings

El nuevo controlador White Wolverine V3 Pro de Razer es de $ 60 de descuento en Amazon, pero probablemente no por mucho tiempo

El nuevo controlador White Wolverine V3 Pro de Razer es de $ 60 de descuento en Amazon, pero probablemente no por mucho tiempo

El controlador de edición especial de Xbox Pulse Cipher obtiene descuento del día de lanzamiento en Amazon

El controlador de edición especial de Xbox Pulse Cipher obtiene descuento del día de lanzamiento en Amazon