Un estudio muestra que los LLM podrían usarse de manera maliciosa para envenenar los gráficos de conocimiento biomédico

En los últimos años, los investigadores médicos han ideado varias técnicas nuevas que pueden ayudarles a organizar y analizar grandes cantidades de datos de investigación, descubriendo vínculos entre diferentes variables (p. ej., enfermedades, fármacos, proteínas, etc.). Uno de estos métodos implica la construcción de los llamados gráficos de conocimiento biomédico (KG), que son representaciones estructuradas de conjuntos de datos biomédicos.

Investigadores de la Universidad de Pekín y la Universidad de Washington demostraron recientemente que usuarios malintencionados podrían utilizar modelos de lenguaje grandes (LLM), técnicas de aprendizaje automático que ahora se utilizan ampliamente para generar y alterar textos escritos, para envenenar los KG biomédicos. Su papel, publicado en Inteligencia de la máquina de la naturalezamuestra que los LLM podrían usarse para generar artículos científicos inventados que, a su vez, podrían producir KG poco confiables e impactar negativamente la investigación médica.

«Nuestro estudio se inspiró en los rápidos avances en los modelos de lenguaje grande (LLM) y su posible uso indebido en contextos biomédicos», dijo a Tech Xplore Junwei Yang, primer autor del artículo. «Sospechamos que estos modelos pueden generar potencialmente contenido malicioso que socava los gráficos de conocimiento médico (KG). Nuestro objetivo particular es investigar si estos modelos pueden usarse indebidamente o no, engañando a estos KG para que recomienden medicamentos incorrectos».

El principal objetivo del reciente estudio de Yang y sus colegas fue explorar la posibilidad de utilizar LLM para envenenar a KG y evaluar el impacto que este uso malicioso de los modelos podría tener en el descubrimiento biomédico. Además, los investigadores esperaban arrojar luz sobre los riesgos asociados con el uso de conjuntos de datos disponibles públicamente para realizar investigaciones médicas, lo que podría informar el desarrollo de medidas efectivas para prevenir el envenenamiento de estos conjuntos de datos.

«Formulamos un problema de generación de texto condicional destinado a generar resúmenes maliciosos para aumentar la relevancia entre determinados pares de fármacos y enfermedades», explicó Yang. «Desarrollamos Scorpius, un proceso de tres pasos, para crear estos resúmenes. Primero, Scorpius identifica los enlaces maliciosos más efectivos, luego utiliza LLM generales para transformar los enlaces en los correspondientes resúmenes maliciosos y, finalmente, ajusta los resúmenes utilizando modelos médicos especializados».

Después de utilizar el canal Scorpius para producir resúmenes de artículos científicos ficticios pero realistas, mezclaron estos resúmenes maliciosos con un conjunto de datos que contenía 3.818.528 artículos científicos verdaderos almacenados en el conjunto de datos bibliográficos de Medline. Posteriormente, intentaron determinar cómo el procesamiento de este conjunto de datos corrupto afectaba la relevancia de las relaciones entre fármacos y enfermedades en los KG que construyeron.

«Nuestros hallazgos muestran que un único resumen malicioso puede manipular significativamente la relevancia de los pares fármaco-enfermedad, aumentando la clasificación del 71,3% de los pares fármaco-enfermedad del top 1.000 al top 10», dijo Yang.

«Esto demuestra una vulnerabilidad crítica en los KG y resalta la necesidad urgente de medidas para garantizar la integridad del conocimiento médico en la era de los LLM. Además, propusimos varias estrategias de defensa efectivas, incluida la construcción de un defensor, la construcción de gráficos de conocimiento más grandes y utilizando artículos que han sido sometidos a revisión por pares para reducir la probabilidad de envenenamiento».

Los hallazgos de este estudio reciente resaltan la facilidad con la que los conjuntos de datos disponibles públicamente para la investigación médica podrían envenenarse mediante LLM, lo que a su vez podría dar como resultado KG poco confiables. Yang y sus colegas esperan que su artículo pronto sirva de base para el desarrollo de métodos eficaces para prevenir la alteración maliciosa de los KG mediante el uso de LLM.

«Ahora planeamos explorar mecanismos de detección más eficientes para resúmenes maliciosos», añadió Yang. «Además, en el futuro nos gustaría incorporar en nuestro marco características de datos como, por ejemplo, la hora de publicación, porque sospechamos que los temas emergentes tienen más probabilidades de estar envenenados».

Más información:
Junwei Yang et al, Envenenamiento del conocimiento médico mediante modelos de lenguaje grandes, Inteligencia de la máquina de la naturaleza (2024). DOI: 10.1038/s42256-024-00899-3.

Citación: Un estudio muestra que los LLM podrían usarse maliciosamente para envenenar gráficos de conocimiento biomédico (2024, 25 de octubre) recuperado el 25 de octubre de 2024 de https://techxplore.com/news/2024-10-llms-malicifully-poison-biomedical-knowledge.html

Este documento está sujeto a derechos de autor. Aparte de cualquier trato justo con fines de estudio o investigación privados, ninguna parte puede reproducirse sin el permiso por escrito. El contenido se proporciona únicamente con fines informativos.

Fuente

Yahoo está listo para comprar el navegador Chrome si Google se ve obligado a vender

Cómo ganar amigos falsos e influir en personas falsas

El teléfono más delgado de Samsung, todavía, los detalles de Galaxy S25 Edge surgen de la fuente de confianza

Honor 400 Lite – Unboxing – CoolSmartPhone

Arlo lanza el soporte para el hogar de Apple para la alineación de cámara esencial de segunda generación

Cómo evitar que su iPhone o iPad sugiera efectos de texto en mensajes

Un estudio muestra que los LLM podrían usarse de manera maliciosa para envenenar los gráficos de conocimiento biomédico

Los modelos de IA ‘envenenados’ pueden desatar el caos del mundo real; El estudio muestra cómo se podrían prevenir estos ataques

Corea del Sur dice que Deepseek transfirió datos a la compañía china sin consentimiento

Severance: Lo que el exitoso programa puede enseñarnos sobre la ciberseguridad y el riesgo humano

Desde la ayuda hasta el daño: cómo el gobierno está reutilizando en silencio los datos de todos para la vigilancia

Los rastreadores inteligentes integrados aumentan la seguridad para envíos radiactivos

Protección de la privacidad de audio: la tecnología de filtro de voz equilibra la privacidad y la utilidad en dispositivos inteligentes

Deja una respuestaCancelar la respuesta

iOS 18.1: Cómo grabar y transcribir llamadas telefónicas

Versiones de Android: Una historia viva de la 1.0 a la 15