Anthrope ha mostrado un nuevo marco de seguridad, diseñado para reducir el riesgo de contenido dañino generado por sus grandes modelos de idiomas (LLM), un movimiento que podría tener implicaciones de largo alcance para las empresas tecnológicas empresariales.
Los modelos de lenguaje grande se someten a una amplia capacitación en seguridad para evitar resultados dañinos, pero siguen siendo vulnerables a los jailbreaks: entradas diseñadas para evitar las barandillas de seguridad y provocar respuestas dañinas, dijo Anthrope en un comunicado.
GIPHY App Key not set. Please check settings