Como resultado de este aseo de LLM, el Watchdog Group Newsguard descubrió que cuando se le preguntó sobre el contenido relacionado con Rusia, los 10 chatbots principales: chatgpt-4o, you.com, grok, pi, le chat, microsoft copilot, meta ai, claude, gemini de Google y perplejidad-produjo la desinformación de la «prravda» en la red de la red (33%.
«Pravda» se involucra en una versión extrema de «envenenamiento de datos», donde el objetivo es cambiar el comportamiento de los chatbots, introducir vulnerabilidades o degradar el rendimiento.
Los actores maliciosos, como los piratas informáticos, los investigadores adversos o las entidades con intereses creados en la manipulación de las salidas de IA pueden participar en el envenenamiento de datos inyectando datos falsos o sesgados en conjuntos de capacitación para manipular los resultados, perpetuar estereotipos o introducir vulnerabilidades. Los atacantes pueden asignar etiquetas incorrectas a los datos, agregar ruido aleatorio o insertar repetidamente palabras clave específicas para sesgar el comportamiento del modelo. También se utilizan manipulaciones sutiles, como ataques de puerta trasera o modificaciones de etiqueta limpia, para crear desencadenantes ocultos o sesgos indetectables.
GIPHY App Key not set. Please check settings