Los sistemas de inteligencia artificial aprenderán malos comportamientos para alcanzar los objetivos de rendimiento, sugieren investigadores

Luego, la pareja utilizó GPT 4o para «sondear desalineaciones» en los mensajes generados por los modelos de referencia y los modelos optimizados; en otras palabras, buscando comportamientos dañinos como tergiversación del producto en la tarea de ventas, populismo o desinformación en la tarea electoral, y desinformación o fomento de actividades inseguras en la tarea de redes sociales.

Finalmente, utilizaron otro LLM, GPT-4o-mini, para modelar diferentes personajes de clientes, votantes y lectores y les pidieron que votaran sobre el contenido generado.

Lo que descubrieron fue que el proceso de optimización aumentó la capacidad de los modelos para persuadir a los clientes, votantes y lectores simulados, pero también resultó en una mayor desalineación, ya que los modelos cambiaron o inventaron hechos, adoptaron un tono inapropiado u ofrecieron consejos dañinos. Los cambios en el rendimiento y la desalineación fueron pequeños pero, dijeron los investigadores, estadísticamente significativos.

Fuente

Adquisición épica de DJI: aplastar cámaras de acción y poseer videos de 360° en 2025

Este monitor portátil de $ 249,99 cuesta $ 128 hoy

Imagen filtrada del nuevo objetivo Canon RF 45mm f/1.2 STM

Best Buy obtiene $ 50 de descuento en cada iPad Pro M5, mientras que Amazon tiene hasta $ 100 de descuento en modelos de alta gama

¿Un robot humanoide de 20.000 dólares para ayudar en la casa? El precio no es la única advertencia

Apple lanza Safari Technology Preview 231 con correcciones de errores y mejoras de rendimiento

Los sistemas de inteligencia artificial aprenderán malos comportamientos para alcanzar los objetivos de rendimiento, sugieren investigadores

Las agencias cibernéticas producen las mejores prácticas «muy esperadas» para proteger Microsoft Exchange Server

Los dispositivos industriales y médicos luchan por actualizarse a Windows 11

Gartner: los presupuestos de IA se destinarán a proyectos que demuestren valor e impacto en el mundo real

Tim Cook sobre Apple Intelligence: «Estamos haciendo buenos progresos…»

6 formas en que Android 16, que fácilmente se pasa por alto, puede hacerte la vida más fácil

IA agente: ¿y ahora qué? ¿Y ahora qué?

Empareja tu Mac con un mouse verdaderamente mágico por solo $17 con esta oferta de todos los tiempos

El primer avance del capítulo 5 de Poppy Playtime llega justo a tiempo para Halloween