in

Limpieza de las redes sociales con aprendizaje automático

correo no deseado

correo no deseado

Crédito: CC0 Dominio público

El spam de contenido para adultos o pornográfico es un problema creciente en las redes sociales. Nuevas investigaciones en el Revista internacional de inteligencia comercial y minería de datos analiza cómo dicho contenido puede detectarse rápidamente y eliminarse de manera oportuna.

Deepali Dhaka, Surbhi Kakar y Monica Mehrotra de Jamia Millia Islamia (Universidad Central) en Jamia Nagar, Nueva Delhi, India, explican cómo se podría mejorar la experiencia general del usuario y la de los jóvenes que usan las redes sociales si se filtra el contenido de spam obsceno. con eficacia y rapidez. Las herramientas de aprendizaje automático suelen ser el camino a seguir para detectar tipos particulares de contenido y el equipo ha demostrado que una de esas herramientas, XGboost, puede detectar contenido de spam para adultos con más del 90 % de precisión. Este fue el algoritmo de clasificación más efectivo de los seis probados y adaptados por el equipo para detectar spam pornográfico en Twitter.

Como tal, menos de diez de cada cien actualizaciones marcadas como spam para adultos serían falsos positivos. El enfoque del equipo necesitaba analizar solo una pequeña cantidad de características, el sistema de valores, la entropía de las palabras, la diversidad léxica y las incrustaciones de palabras, para poder extraer actualizaciones de spam para adultos del flujo general de actualizaciones en uno de los más conocidos. plataformas de redes sociales, Twitter.

Inherente a la detección positiva es que, en general, los usuarios cotidianos de la plataforma discuten una amplia variedad de temas en diferentes contextos y escriben y comparten en lo que podría denominarse una forma orgánica. Por el contrario, los spammers y los spammers pornográficos, en este caso, tienden a tener un enfoque fijo o incluso completamente automatizado para sus actualizaciones, una diversidad limitada de temas, como cabría esperar, y un léxico muy limitado. Estas y otras características de los mensajes de spam los hacen reconocibles para el algoritmo.


Twitter dice que elimina 1 millón de cuentas de spam al día


Más información:
Monica Mehrotra et al, Detección de spammers que difunden contenido obsceno en Twitter, Revista internacional de inteligencia comercial y minería de datos (2021). DOI: 10.1504/IJBIDM.2022.10040432

Citación: Limpieza de las redes sociales con aprendizaje automático (7 de septiembre de 2022) recuperado el 13 de septiembre de 2022 de https://techxplore.com/news/2022-09-social-media-machine.html

Este documento está sujeto a derechos de autor. Aparte de cualquier trato justo con fines de estudio o investigación privados, ninguna parte puede reproducirse sin el permiso por escrito. El contenido se proporciona únicamente con fines informativos.



Fuente

Written by TecTop

Apple, iPhone, iOS, MDM, enterprise, security, data separation

Más de 14 razones por las que las empresas deberían actualizarse a iOS 16

Sony PlayStation State of Play esta noche: qué esperar y dónde mirar