Detección automatizada de doxing en Twitter con más del 96 % de precisión

niño en la computadora — Crédito: Unsplash/CC0 Dominio público

Un nuevo enfoque automatizado para detectar el doxing, una forma de acoso cibernético en el que cierta información privada o de identificación personal se comparte públicamente sin el consentimiento o el conocimiento de un individuo, puede ayudar a las plataformas de redes sociales a proteger mejor a sus usuarios, según investigadores de la Facultad de Ciencias de la Información de Penn State. y Tecnología.

La investigación sobre el doxing podría llevar a marcar y eliminar de forma más inmediata la información personal confidencial que se haya compartido sin la autorización del propietario. Hasta la fecha, el equipo de investigación solo ha estudiado Twitter, donde su novedoso enfoque propuesto utiliza el aprendizaje automático para diferenciar qué tweet que contiene información de identificación personal se comparte maliciosamente en lugar de revelarse a sí mismo.

Han identificado un enfoque que pudo detectar automáticamente el doxing en Twitter con más del 96% de precisión, lo que podría ayudar a la plataforma, y eventualmente a otras plataformas de redes sociales, a identificar más rápida y fácilmente los casos reales de doxing.

«El enfoque es identificar casos en los que las personas recopilan información personal confidencial sobre otros y la divulgan públicamente como una forma de asustarlos, difamarlos, amenazarlos o silenciarlos», dijo Younes Karimi, candidato a doctorado y autor principal del artículo. «Esto es peligroso porque una vez que se publica esta información, se puede compartir rápidamente con muchas personas e incluso ir más allá de Twitter. La persona a quien pertenece la información debe estar protegida».

En su trabajo, los investigadores recopilaron y seleccionaron un conjunto de datos de casi 180 000 tuits que probablemente contenían información falsa. Usando técnicas de aprendizaje automático, clasificaron los datos como información personal vinculada a la identidad de una persona (su número de seguro social) o a la ubicación de una persona (su dirección IP) y etiquetaron manualmente más de 3100 de los tweets que se encontró que contenían cualquiera de las partes. de información.

Luego clasificaron aún más los datos para diferenciar las divulgaciones maliciosas de las autodivulgaciones. A continuación, los investigadores examinaron los tuits en busca de motivaciones potenciales comunes detrás de las revelaciones, determinaron si la intención era probablemente defensiva o maliciosa e indicaron si podría caracterizarse como doxing.

«No todos los casos de doxing son necesariamente maliciosos», explicó Karimi. «Por ejemplo, un padre de un niño desaparecido podría compartir benignamente su información privada con la desesperada esperanza de encontrarlo».

A continuación, los investigadores utilizaron nueve enfoques diferentes basados en métodos y modelos de procesamiento de lenguaje natural existentes para detectar automáticamente instancias de doxing y divulgaciones maliciosas de dos tipos de información privada más confidencial, el número de seguro social y la dirección IP, en su conjunto de datos recopilados.

Compararon los resultados e identificaron el enfoque con la tasa de precisión más alta, y presentaron sus hallazgos en noviembre en la 25.ª Conferencia de la ACM sobre trabajo cooperativo asistido por computadora y computación social.

Según Karimi, este trabajo es especialmente crítico en un momento en que las principales plataformas de redes sociales, incluido Twitter, están realizando despidos masivos, minimizando la cantidad de trabajadores responsables de revisar el contenido que puede violar los términos de servicio de las plataformas.

La política de una plataforma, por ejemplo, establece que, a menos que un caso de doxing tenga una intención claramente abusiva, el propietario de la información compartida públicamente o su representante autorizado debe comunicarse con la plataforma antes de que se tomen medidas de cumplimiento. Según esta política, la información privada podría permanecer disponible públicamente durante largos períodos de tiempo si el propietario de la información no sabe que se ha compartido.

«Si bien existen algunos estudios previos sobre la detección de información privada en general y las plataformas de redes sociales aplican algunos enfoques automatizados para detectar el ciberacoso, no diferencian las auto-revelaciones de las divulgaciones maliciosas de segundas y terceras partes en tweets», dijo. dijo.

«Ahora hay menos personas a cargo de tomar medidas para estos informes de usuario manuales, por lo que agregar automatización puede ayudarlos a reducir los informes más importantes y confidenciales y priorizarlos».

El artículo se publica como parte de la Actas de la ACM sobre interacción humano-computadora.

Más información:
Younes Karimi et al, Detección automatizada de doxing en Twitter, Actas de la ACM sobre interacción humano-computadora (2022). DOI: 10.1145/3555167

Proporcionado por la Universidad Estatal de Pensilvania

Citación: Detección automatizada de doxing en Twitter con más del 96 % de precisión (12 de diciembre de 2022) consultado el 12 de diciembre de 2022 en https://techxplore.com/news/2022-12-automated-doxing-twitter-accuracy.html

Este documento está sujeto a derechos de autor. Aparte de cualquier trato justo con fines de estudio o investigación privados, ninguna parte puede reproducirse sin el permiso por escrito. El contenido se proporciona únicamente con fines informativos.

Fuente

Samsung hizo que estos buenos módulos de bloqueo sean más potentes y un UI de UI

Honor Anuncie ‘AI Image to Video’ para la serie Honor 400 – Coolsmartphone

Hola desarrollador: junio de 2025 – Discover – Desarrollador de Apple

Comparación de la vida real entre el Sony RX1RIII y el RX1RII de 10 años

Boulies lanza la silla EP300 para una experiencia sentada verdaderamente ergonómica mientras trabaja, juegos o relajado – CoolsMartPhone

MacBook Pros no suele alcanzar $ 325, pero este sí lo hace

Detección automatizada de doxing en Twitter con más del 96 % de precisión

‘Stuck in Limbo’: más del 90% de las notas comunitarias de X inéditas, dice el estudio

Los usuarios de Microsoft Outlook experimentan una interrupción del horario de tiempo que impacta el acceso al correo electrónico

El último chatbot de Musk’s Grok busca las opiniones de Mogul de multimillonario antes de responder preguntas

Xai se disculpa por las publicaciones ofensivas de Grok

Cómo Eurostack podría ofrecer a Canadá una ruta a la independencia digital de los Estados Unidos

El Reino Unido comienza los cheques en línea para evitar que los niños accedan a contenido dañino

El último juego gratuito para PC de GOG es un RPG de acción adorable