El aprendizaje federado representa un cambio significativo en el panorama del aprendizaje automático, ya que permite a muchos clientes o dispositivos entrenar modelos de forma colaborativa y al mismo tiempo mejorar sustancialmente la privacidad de los datos involucrados.
A diferencia de los enfoques de aprendizaje centralizado convencionales, donde es necesario compartir datos de capacitación sin procesar, el aprendizaje federado permite a los participantes mantener sus datos individuales localizados, intercambiando solo actualizaciones del modelo. Este método protege la información confidencial y reduce los riesgos asociados con el almacenamiento central de datos.
En el modelo típico de aprendizaje federado, conocido como aprendizaje federado asistido por servidor, un servidor central desempeña un papel crucial. Coordina el proceso de capacitación enviando el modelo global actual a los clientes e integrando sus modelos locales para mejorar iterativamente el modelo general.
Sin embargo, esta centralización introduce varios inconvenientes. Primero, la carga de comunicación es inmensa; el servidor debe manejar grandes cantidades de datos enviados y recibidos desde potencialmente miles de clientes. En segundo lugar, la dependencia de un único servidor introduce una vulnerabilidad; Si el servidor falla debido a problemas de hardware o software, todo el proceso de capacitación se detiene.
Aprendizaje federado descentralizado y vulnerabilidades
Para mitigar estos problemas, se ha propuesto como alternativa el aprendizaje federado descentralizado. En este marco, se elimina el servidor central y los clientes se comunican directamente entre sí, compartiendo modelos de igual a igual. Esta arquitectura no solo reduce el punto único de falla sino que también disminuye la sobrecarga de comunicación asociada con un servidor central. Nuestro estudio fue publicado en el Actas de la Conferencia ACM SIGSAC 2024 sobre seguridad informática y de las comunicaciones.
Es particularmente beneficioso en entornos donde la confianza en una única entidad central es problemática, o donde entidades como hospitales o instituciones financieras son reacias a compartir datos debido a preocupaciones de privacidad o restricciones regulatorias. La Figura 1 ilustra las distinciones entre el aprendizaje federado asistido por servidor y el aprendizaje federado descentralizado.
Sin embargo, el aprendizaje federado descentralizado introduce nuevos desafíos, en particular la vulnerabilidad a ataques de envenenamiento. En tales ataques, clientes maliciosos inyectan datos falsos en el sistema, con el objetivo de corromper los modelos entrenados colectivamente. Esto es particularmente problemático porque cada cliente en una red descentralizada tiene una visión limitada del sistema general, lo que dificulta la detección de anomalías o actividades maliciosas de forma independiente.
Nuevo mecanismo de defensa para asegurar el aprendizaje federado descentralizado
Para abordar estas preocupaciones de seguridad, hemos desarrollado un mecanismo novedoso llamado BALANCE, una regla de agregación robusta y bizantina diseñada específicamente para el entorno de aprendizaje federado descentralizado. BALANCE es único porque no requiere que la red de clientes esté completamente conectada, lo cual es una limitación común en muchas estrategias de defensa existentes. En cambio, opera según el principio de que cada cliente puede utilizar su modelo local como punto de referencia para evaluar la confiabilidad de los modelos recibidos de sus vecinos.
Según la regla BALANCE, cada cliente evalúa los modelos entrantes comparándolos con su propio modelo. Si un modelo entrante se desvía significativamente del modelo del cliente de una manera que sugiere una posible manipulación o intenciones maliciosas, se rechaza automáticamente. Esta estrategia de evaluación local permite que cada cliente se defienda de forma independiente contra posibles amenazas a la seguridad, mejorando la solidez general de la red contra ataques coordinados.
La introducción de BALANCE en el aprendizaje federado descentralizado ofrece una solución prometedora a uno de los problemas de seguridad más urgentes que enfrenta este campo emergente. Al permitir que cada cliente actúe como su propio guardián, BALANCE garantiza que se mantenga la integridad del proceso de capacitación, incluso en un entorno altamente distribuido y descentralizado.
Esta historia es parte de Diálogo Ciencia Xdonde los investigadores pueden informar los resultados de sus artículos de investigación publicados. Visita esta pagina para obtener información sobre Science X Dialog y cómo participar.
Más información:
Minghong Fang et al, Aprendizaje federado descentralizado robusto y bizantino, Actas de la Conferencia ACM SIGSAC 2024 sobre seguridad informática y de las comunicaciones (2024). DOI: 10.1145/3658644.3670307
El Dr. Minghong Fang es profesor asistente titular en el Departamento de Ingeniería y Ciencias de la Computación de la Universidad de Louisville.
Citación: Asegurar el futuro de la IA: Innovaciones en el aprendizaje federado descentralizado (2025, 13 de enero) obtenido el 13 de enero de 2025 en https://techxplore.com/news/2025-01-future-ai-decentralized-federated.html
Este documento está sujeto a derechos de autor. Aparte de cualquier trato justo con fines de estudio o investigación privados, ninguna parte puede reproducirse sin el permiso por escrito. El contenido se proporciona únicamente con fines informativos.
GIPHY App Key not set. Please check settings