Experimentos antrópicos con introspección de IA

Sin embargo, esta capacidad de introspección es limitada y “muy poco fiable”, subrayan los investigadores de Anthropic. Los modelos (al menos por ahora) todavía no pueden hacer una introspección como lo hacen los humanos, o en la medida en que lo hacemos nosotros.

Comprobando sus intenciones

Los investigadores antrópicos querían saber si Claude podía describir y, en cierto sentido, reflexionar sobre su razonamiento. Esto requirió que los investigadores compararan los «pensamientos» autoinformados de Claude con procesos internos, algo así como conectar a un humano a un monitor cerebral, hacer preguntas y luego analizar el escaneo para mapear los pensamientos en las áreas del cerebro que activaban.

Los investigadores probaron la introspección del modelo con «inyección de conceptos», que esencialmente implica introducir ideas completamente no relacionadas (vectores de IA) en un modelo cuando está pensando en otra cosa. Luego se le pide al modelo que retroceda, identifique el pensamiento intercalado y lo describa con precisión. Según los investigadores, esto sugiere que se trata de una «introspección».

Fuente

Ahorre espacio con este práctico soporte de carga Anker 3 en 1 con un descuento de $30

Aproveche estas 24 ofertas de aspiradoras robóticas del Black Friday mientras duren

Mis asistentes de compras con IA están atrapados en el pasado

Las más de 30 mejores ofertas de Apple del Black Friday en AirPods, iPads, MacBooks y más

Sony Alemania muestra una imagen de la nueva Sony A7V

Cómo hacer crecer una ensalada de jardín

Comprobando sus intenciones

El iPhone de Apple ha recuperado la corona de ventas de smartphones

OpenAI amplía la residencia de datos para clientes empresariales

Microsoft pierde a dos líderes senior de infraestructura de IA a medida que aumentan las presiones en los centros de datos

HP recortará hasta 6.000 puestos de trabajo a medida que los costos de los componentes y la IA cambien la forma de las operaciones

¿Vision Pro tiene un lugar en la empresa?

Cómo utiliza LinkedIn la IA para mejorar sus funciones de búsqueda de empleo

Apple retrasa el requisito de actualización de la aplicación Home hasta febrero de 2026

EA reconoce el riesgo de vender a Arabia Saudita y afirma que conservará el control creativo