Los científicos informáticos de UC Riverside están desarrollando herramientas para ayudar a rastrear y monitorear los síntomas de COVID-19 y filtrar la información errónea sobre la enfermedad en las redes sociales.
Utilizando datos de Google Trends, un grupo dirigido por Vagelis Papalexakis, profesor asociado de la Facultad de Ingeniería Marlan and Rosemary Bourns; y Jia Chen, profesor asistente de enseñanza, desarrollaron un algoritmo que identificó tres síntomas únicos de COVID-19 en comparación con la gripe: ageusia (pérdida de la función del gusto de la lengua) dificultad para respirar y anosmia o pérdida del olfato. El algoritmo fue desarrollado en colaboración con dos estudiantes graduados, Md Imrul Kaish y Md Jakir Hossain, en la Universidad de Texas Rio Grande Valley.
«Gran parte del trabajo con Google Trends para la gripe se ha centrado en pronosticar la temporada de gripe», dijo Papalexakis. «Nosotros, por otro lado, lo usamos para ver si podíamos encontrar una aguja en un pajar: síntomas únicos de COVID-19 entre todos los síntomas similares a los de la gripe que la gente busca».
Los investigadores localizaron síntomas en Google Trends para 2019 y 2020 y utilizaron una técnica que llamaron análisis discriminativo no negativo, o ADN, para extraer términos que eran exclusivos de un conjunto de datos en relación con el otro.
«Asumimos que las búsquedas de síntomas en 2019 conducirían a la influenza u otras dolencias respiratorias, mientras que las búsquedas de los mismos síntomas en 2020 podrían ser ambas», dijo Chen. «Utilizando el ADN, pudimos encontrar la diferencia entre los dos conjuntos de datos. Esto resultó ser términos que los médicos ya han identificado como exclusivos de COVID-19, lo que demuestra que nuestro enfoque funciona».
Papalexakis y Chen esperan que su trabajo ayude a los epidemiólogos y otros expertos en salud pública a rastrear y monitorear COVID-19 utilizando Google Trends como un proxy para los datos hospitalarios.
«Los datos de tendencias de Google son muy ruidosos, pero los datos de los hospitales no están disponibles públicamente. Las personas pueden buscar síntomas porque los están experimentando o porque han oído hablar de ellos y quieren saber más», dijo Papalexakis. «Las búsquedas reflejan el interés en los síntomas mejor que las personas que los experimentan activamente, pero dada la falta de otros datos, creemos que esta herramienta podría ayudar a los investigadores a comprender mejor los síntomas».
Chen dijo que el algoritmo es simple y fácil de implementar como parte de una herramienta potencial que puede ayudar a los científicos que investigan otras enfermedades a conocer los síntomas potenciales.
El documento, «¿COVID-19 o gripe? Descubrimiento de conocimiento discriminativo de síntomas de COVID-19 a partir de datos de tendencias de Google», se presentó en epiDAMIK 2021, un taller sobre minería de datos para avanzar en el conocimiento epidemiológico. El taller se organizó como parte de la mayor conferencia anual sobre ciencia de datos, la Association for Computing Machinery’s, o ACM, Grupo de interés especial sobre descubrimiento de conocimientos y minería de datos.
Papalexakis y el estudiante de doctorado de UC Riverside William Shiao también están desarrollando una herramienta que no solo identifica la información errónea de COVID-19, sino que muestra por qué la información está marcada como falsa en relación con una base de datos de artículos científicos sobre investigaciones sobre coronavirus.
Papalexakis y Shiao utilizaron 90.000 artículos del COVID-19 Open Research Dataset Challenge (CORD-19) preparado por la Casa Blanca y una coalición de grupos de investigación, y recopilaron 20.000 artículos «en la naturaleza» con información errónea sobre el nuevo coronavirus. Usando un método de incrustación basado en matrices de similitud que llamaron KI2TE, los artículos se vincularon a un conjunto de documentos de referencia y se interpretaron. Los documentos utilizados como referencia fueron un conjunto de artículos académicos sobre la investigación del coronavirus incluidos en el conjunto de datos CORD-19.
Cuando se probó en artículos que habían sido etiquetados por humanos como falsos o identificados por Google Fact Check como falsos, su método no solo identificó correctamente las historias falsas, sino que también señaló las fuentes científicas que corroboraron la decisión del sistema.
«No estamos interesados en censurar lo que la gente ve. Queremos ir más allá de ocultar algo por completo o simplemente mostrar una etiqueta de advertencia», dijo Papalexakis. «También queremos mostrarles fuentes para educarlos».
Aunque la herramienta desarrollada por Papalexakis y Shiao es un prototipo en desarrollo de investigación activa, eventualmente podría incorporarse en una aplicación de teléfono inteligente o en plataformas de redes sociales como Facebook.
¿COVID-19 o gripe? Descubrimiento de conocimiento discriminativo de los síntomas de COVID-19 a partir de los datos de Google Trends. www.cs.ucr.edu/~epapalex/papers/epidamik_kdd21.pdf
KI2TE: Incrustaciones interpretables infundidas de conocimiento para la detección de información errónea de COVID-19. www.cs.ucr.edu/~epapalex/paper… Knod2021_paper_7.pdf
Citación: Las herramientas de minería de datos combaten la desinformación de COVID-19 e identifican síntomas (2021, 20 de agosto) recuperado el 20 de agosto de 2021 de https://techxplore.com/news/2021-08-tools-combat-covid-misinformation-symptoms.html
Este documento está sujeto a derechos de autor. Aparte de cualquier trato justo con fines de estudio o investigación privados, no se puede reproducir ninguna parte sin el permiso por escrito. El contenido se proporciona únicamente con fines informativos.
GIPHY App Key not set. Please check settings