Finalmente: un suero de la verdad para mentir chatbots genai

Como resultado de este aseo de LLM, el Watchdog Group Newsguard descubrió que cuando se le preguntó sobre el contenido relacionado con Rusia, los 10 chatbots principales: chatgpt-4o, you.com, grok, pi, le chat, microsoft copilot, meta ai, claude, gemini de Google y perplejidad-produjo la desinformación de la «prravda» en la red de la red (33%.

«Pravda» se involucra en una versión extrema de «envenenamiento de datos», donde el objetivo es cambiar el comportamiento de los chatbots, introducir vulnerabilidades o degradar el rendimiento.

Los actores maliciosos, como los piratas informáticos, los investigadores adversos o las entidades con intereses creados en la manipulación de las salidas de IA pueden participar en el envenenamiento de datos inyectando datos falsos o sesgados en conjuntos de capacitación para manipular los resultados, perpetuar estereotipos o introducir vulnerabilidades. Los atacantes pueden asignar etiquetas incorrectas a los datos, agregar ruido aleatorio o insertar repetidamente palabras clave específicas para sesgar el comportamiento del modelo. También se utilizan manipulaciones sutiles, como ataques de puerta trasera o modificaciones de etiqueta limpia, para crear desencadenantes ocultos o sesgos indetectables.

Fuente

Battlefield Redsec se está deshaciendo del Marauder Marauder tremendamente dominado de Battle Royale

ChatGPT obtiene la actualización instantánea GPT-5.3 con menos ‘vergüenza’ y menos alucinaciones

Las mejores ofertas de Nintendo Switch esta semana (3 de marzo de 2026)

Los AirPods 4 con ANC caen al precio más bajo de 2026

El paquete Story Rich Adventures de Fanatical incluye 17 increíbles juegos narrativos

Primera superficie de pruebas comparativas del iPad Air M4

Finalmente: un suero de la verdad para mentir chatbots genai

Apple presenta su familia de portátiles Mac M5 de próxima generación

Los phishers de OAuth hacen que el consejo de «comprobar dónde apunta el enlace» sea ineficaz

¿Qué es la experiencia digital de los empleados y por qué es más importante que nunca?

Investigadores advierten sobre el nuevo servicio de salud de ChatGPT

OpenAI dice que su acuerdo de defensa con Estados Unidos es más seguro que el de Anthropic, pero ¿lo es?

Apple anuncia el iPhone 17e y un nuevo iPad Air con tecnología M4

Deja una respuestaCancelar la respuesta

iOS 18.3.2 se lanza con una sola solución de WebKit crítica

Marvel Rivals está regalando las caídas de Twitch con temas de Adam Warlock