Las herramientas de minería de datos combaten la desinformación de COVID-19 e identifican síntomas

procesamiento de datos — Crédito: Pixabay / CC0 Public Domain

Los científicos informáticos de UC Riverside están desarrollando herramientas para ayudar a rastrear y monitorear los síntomas de COVID-19 y filtrar la información errónea sobre la enfermedad en las redes sociales.

Utilizando datos de Google Trends, un grupo dirigido por Vagelis Papalexakis, profesor asociado de la Facultad de Ingeniería Marlan and Rosemary Bourns; y Jia Chen, profesor asistente de enseñanza, desarrollaron un algoritmo que identificó tres síntomas únicos de COVID-19 en comparación con la gripe: ageusia (pérdida de la función del gusto de la lengua) dificultad para respirar y anosmia o pérdida del olfato. El algoritmo fue desarrollado en colaboración con dos estudiantes graduados, Md Imrul Kaish y Md Jakir Hossain, en la Universidad de Texas Rio Grande Valley.

«Gran parte del trabajo con Google Trends para la gripe se ha centrado en pronosticar la temporada de gripe», dijo Papalexakis. «Nosotros, por otro lado, lo usamos para ver si podíamos encontrar una aguja en un pajar: síntomas únicos de COVID-19 entre todos los síntomas similares a los de la gripe que la gente busca».

Los investigadores localizaron síntomas en Google Trends para 2019 y 2020 y utilizaron una técnica que llamaron análisis discriminativo no negativo, o ADN, para extraer términos que eran exclusivos de un conjunto de datos en relación con el otro.

«Asumimos que las búsquedas de síntomas en 2019 conducirían a la influenza u otras dolencias respiratorias, mientras que las búsquedas de los mismos síntomas en 2020 podrían ser ambas», dijo Chen. «Utilizando el ADN, pudimos encontrar la diferencia entre los dos conjuntos de datos. Esto resultó ser términos que los médicos ya han identificado como exclusivos de COVID-19, lo que demuestra que nuestro enfoque funciona».

Papalexakis y Chen esperan que su trabajo ayude a los epidemiólogos y otros expertos en salud pública a rastrear y monitorear COVID-19 utilizando Google Trends como un proxy para los datos hospitalarios.

«Los datos de tendencias de Google son muy ruidosos, pero los datos de los hospitales no están disponibles públicamente. Las personas pueden buscar síntomas porque los están experimentando o porque han oído hablar de ellos y quieren saber más», dijo Papalexakis. «Las búsquedas reflejan el interés en los síntomas mejor que las personas que los experimentan activamente, pero dada la falta de otros datos, creemos que esta herramienta podría ayudar a los investigadores a comprender mejor los síntomas».

Chen dijo que el algoritmo es simple y fácil de implementar como parte de una herramienta potencial que puede ayudar a los científicos que investigan otras enfermedades a conocer los síntomas potenciales.

El documento, «¿COVID-19 o gripe? Descubrimiento de conocimiento discriminativo de síntomas de COVID-19 a partir de datos de tendencias de Google», se presentó en epiDAMIK 2021, un taller sobre minería de datos para avanzar en el conocimiento epidemiológico. El taller se organizó como parte de la mayor conferencia anual sobre ciencia de datos, la Association for Computing Machinery’s, o ACM, Grupo de interés especial sobre descubrimiento de conocimientos y minería de datos.

Papalexakis y el estudiante de doctorado de UC Riverside William Shiao también están desarrollando una herramienta que no solo identifica la información errónea de COVID-19, sino que muestra por qué la información está marcada como falsa en relación con una base de datos de artículos científicos sobre investigaciones sobre coronavirus.

Papalexakis y Shiao utilizaron 90.000 artículos del COVID-19 Open Research Dataset Challenge (CORD-19) preparado por la Casa Blanca y una coalición de grupos de investigación, y recopilaron 20.000 artículos «en la naturaleza» con información errónea sobre el nuevo coronavirus. Usando un método de incrustación basado en matrices de similitud que llamaron KI2TE, los artículos se vincularon a un conjunto de documentos de referencia y se interpretaron. Los documentos utilizados como referencia fueron un conjunto de artículos académicos sobre la investigación del coronavirus incluidos en el conjunto de datos CORD-19.

Cuando se probó en artículos que habían sido etiquetados por humanos como falsos o identificados por Google Fact Check como falsos, su método no solo identificó correctamente las historias falsas, sino que también señaló las fuentes científicas que corroboraron la decisión del sistema.

«No estamos interesados en censurar lo que la gente ve. Queremos ir más allá de ocultar algo por completo o simplemente mostrar una etiqueta de advertencia», dijo Papalexakis. «También queremos mostrarles fuentes para educarlos».

Aunque la herramienta desarrollada por Papalexakis y Shiao es un prototipo en desarrollo de investigación activa, eventualmente podría incorporarse en una aplicación de teléfono inteligente o en plataformas de redes sociales como Facebook.

¿Cómo pueden los científicos predecir un brote de COVID-19? Hay una aplicación para eso

Más información:
¿COVID-19 o gripe? Descubrimiento de conocimiento discriminativo de los síntomas de COVID-19 a partir de los datos de Google Trends. www.cs.ucr.edu/~epapalex/papers/epidamik_kdd21.pdf

KI²TE: Incrustaciones interpretables infundidas de conocimiento para la detección de información errónea de COVID-19. www.cs.ucr.edu/~epapalex/paper… Knod2021_paper_7.pdf

Proporcionado por la Universidad de California – Riverside

Citación: Las herramientas de minería de datos combaten la desinformación de COVID-19 e identifican síntomas (2021, 20 de agosto) recuperado el 20 de agosto de 2021 de https://techxplore.com/news/2021-08-tools-combat-covid-misinformation-symptoms.html

Este documento está sujeto a derechos de autor. Aparte de cualquier trato justo con fines de estudio o investigación privados, no se puede reproducir ninguna parte sin el permiso por escrito. El contenido se proporciona únicamente con fines informativos.

Fuente

Yahoo está listo para comprar el navegador Chrome si Google se ve obligado a vender

Cómo ganar amigos falsos e influir en personas falsas

El teléfono más delgado de Samsung, todavía, los detalles de Galaxy S25 Edge surgen de la fuente de confianza

Honor 400 Lite – Unboxing – CoolSmartPhone

Arlo lanza el soporte para el hogar de Apple para la alineación de cámara esencial de segunda generación

Cómo evitar que su iPhone o iPad sugiera efectos de texto en mensajes

Las herramientas de minería de datos combaten la desinformación de COVID-19 e identifican síntomas

Yahoo está listo para comprar el navegador Chrome si Google se ve obligado a vender

El regulador del Reino Unido presenta nuevas medidas principales para proteger a los niños en línea

Google pagó ‘enormes sumas’ de Samsung para las instalaciones de la aplicación Gemini AI, dice Lawyer

YouTube dice más de 20 mil millones de videos subidos en 20 años

Lo que significa el fallo de un juez sobre el ‘monopolio’ de Google sobre la tecnología publicitaria

El juez ataca una ley de Ohio que limita el uso de las redes sociales por parte de los niños como inconstitucionales

Deja una respuestaCancelar la respuesta

Genshin Impact 2.1 se lanza el próximo mes con nuevos personajes e islas

Lanzamiento del nuevo tráiler de Metroid Dread, más información el 27 de agosto

Yahoo está listo para comprar el navegador Chrome si Google se ve obligado a vender

Cómo ganar amigos falsos e influir en personas falsas

El teléfono más delgado de Samsung, todavía, los detalles de Galaxy S25 Edge surgen de la fuente de confianza

Honor 400 Lite – Unboxing – CoolSmartPhone

Arlo lanza el soporte para el hogar de Apple para la alineación de cámara esencial de segunda generación

Cómo evitar que su iPhone o iPad sugiera efectos de texto en mensajes