Investigadores de la Universidad de Melbourne (UoM) y la Universidad de Tecnología y Diseño de Singapur (SUTD) han desarrollado un algoritmo que puede detectar eventos importantes en función del tiempo y la escala geográfica de los temas que se debaten activamente en las redes sociales. Su algoritmo, detallado en el Journal of Big Data, no requiere saber qué eventos detectar por adelantado y se puede adaptar para usar resoluciones geográficas y de tiempo más pequeñas o más grandes para reflejar la naturaleza dinámica de los eventos de la vida real.
Las redes sociales se han convertido en el medio de comunicación de referencia, en gran parte porque las publicaciones se pueden cargar y difundir casi al instante. Dado que muchos usuarios comparten activamente observaciones y fotos de los eventos que suceden a su alrededor, esta información en tiempo real hace que las redes sociales sean una fuente atractiva de noticias de última hora.
Sin embargo, con más de dos tercios de las personas en Internet (o 2.500 millones de personas) que utilizan estas plataformas a nivel mundial, se necesitan estrategias para sortear el ruido y extraer datos útiles específicos de eventos. Para los sucesos potencialmente mortales que requieren personal de emergencia y seguridad, la necesidad de información inmediata y específica del evento es aún más aguda.
«Los elementos del tiempo y el espacio le brindan una mejor resolución de dónde y cuándo están sucediendo los eventos», dijo el coautor del estudio, el profesor asistente de SUTD, Kwan Hui Lim. «Si hay algún tipo de desastre, desea saber dónde y cuándo está sucediendo para poder asignar los recursos adecuados a esa ubicación en particular».
El algoritmo desarrollado por Asst Prof Lim y un equipo dirigido por la profesora Shanika Karunasekera de la UoM adopta una estructura de cuatro fases para identificar eventos en diferentes resoluciones de espacio y tiempo. Dada una secuencia de publicaciones de redes sociales sin procesar con etiquetas geográficas, la primera fase determina la granularidad o resolución en el espacio para detectar eventos. Esto se logra dividiendo un área geográfica en múltiples escalas según la densidad de las publicaciones en las redes sociales.
En la segunda fase, el algoritmo utiliza métodos estadísticos para identificar eventos basados en regiones con una densidad inesperadamente alta o baja de actividad en las redes sociales. Estos eventos, que son fijos en el tiempo, se fusionan en la tercera fase si ocurren en la misma área geográfica en intervalos de tiempo consecutivos, dando una duración estimada para cada evento. La cuarta y última fase luego poda cualquier evento que resulte ser ruido.
Además de la capacidad de adaptar la escala de espacio y tiempo para identificar eventos, el algoritmo es único en el sentido de que no requiere identificación previa de eventos para ser detectados. «Esto tiene ventajas y desventajas», señaló el profesor asistente Lim. «Las ventajas son que no necesita un conjunto de datos preexistente con eventos etiquetados previamente. Sin estos eventos preexistentes, puede usar el algoritmo para detectar eventos nuevos que no haya visto antes. La desventaja es que debe determinar manualmente el umbral que activará una alerta del sistema «.
Los investigadores validaron su algoritmo en flujos de publicaciones provenientes de las principales ciudades del mundo, centrándose en dos plataformas de redes sociales con modalidades muy diferentes: el servicio de microblogging Twitter y la plataforma para compartir fotos Flickr. El nuevo algoritmo superó a dos algoritmos de referencia basados en métricas estándar como la precisión y la recuperación, así como una medida novedosa llamada índice de fuerza desarrollado por el equipo.
El índice de fuerza mide la fracción de entidades principales, que pueden incluir hashtags o menciones en Twitter o etiquetas de imágenes y descripciones en Flickr, respecto al número total de publicaciones sobre el evento detectado. Según Asst Prof Lim, otros dominios que utilizan la recuperación o clasificación de información podrían beneficiarse de la aplicación del índice de fortaleza.
En el futuro, el algoritmo podría fortalecerse haciéndolo multimodal, dijo Asst Prof Lim. Dado que las personas en las redes sociales tienden a ser selectivas en lo que eligen decir y varían el tipo de información que comparten en diferentes plataformas, un algoritmo que puede combinar datos de múltiples fuentes, como Twitter y Flickr, así como los medios de comunicación tradicionales. , puede mejorar la confiabilidad de la detección de eventos.
«Las redes sociales son un tesoro potencial de datos para los gobiernos, los medios de comunicación y las empresas por igual. Es particularmente útil como fuente de noticias de última hora, especialmente para los socorristas como el personal de emergencia y seguridad. Este algoritmo sofisticado ayudará a estas organizaciones a clasificar los ruido para extraer solo la información necesaria que necesitan «, concluyó el profesor Karunasekera.
Yasmeen George et al, Detección de eventos espacio-temporales en tiempo real en redes sociales geoetiquetadas, Revista de Big Data (2021). DOI: 10.1186 / s40537-021-00482-2 Yasmeen George et al, Detección de eventos espacio-temporales en tiempo real en redes sociales geoetiquetadas, Revista de Big Data (2021). DOI: 10.1186 / s40537-021-00482-2
Citación: Resolviendo el dónde y cuándo de los eventos de redes sociales (2021, 24 de septiembre) recuperado el 24 de septiembre de 2021 de https://techxplore.com/news/2021-09-social-media-events.html
Este documento está sujeto a derechos de autor. Aparte de cualquier trato justo con fines de estudio o investigación privados, no se puede reproducir ninguna parte sin el permiso por escrito. El contenido se proporciona únicamente con fines informativos.
GIPHY App Key not set. Please check settings