in

El modelo de IA ligero facilita la generación de imágenes de alta calidad sin transmisión directa de datos confidenciales

El modelo de IA ligero facilita la generación de imágenes de alta calidad sin transmisión directa de datos confidenciales

Resultados cualitativos en el escenario IID con un presupuesto de privacidad. Crédito: arxiv (2025). Doi: 10.48550/arxiv.2503.08085

Se ha desarrollado un nuevo modelo de inteligencia artificial (IA) ultra ligera (AI) que ayuda a generar imágenes de alta calidad sin enviar datos confidenciales a los servidores. Este avance tecnológico allana el camino para la utilización segura de la IA generativa de alto rendimiento en entornos donde la privacidad es primordial, como en el análisis de resonancia magnética de pacientes y tomografías computarizadas.

Un equipo de investigación dirigido por el profesor Jaejun Yoo de la Escuela de Graduados de Inteligencia Artificial en UNIST ha anunciado el desarrollo del Prism (enmascaramiento estocástico mejorado de la privacidad), un modelo de IA de aprendizaje federado. Los hallazgos son publicado en el arxiv servidor de preimpresión.

El aprendizaje federado (FL) es una técnica que permite la creación de una IA global al compilar los resultados de la IA local de cada dispositivo después de realizar el aprendizaje sin necesidad de cargar información confidencial directamente al servidor.

Prism sirve como un modelo de IA que actúa como un mediador que conecta la IA local con IA global durante el proceso de aprendizaje federado. Este modelo reduce los costos de comunicación en un promedio de 38% en comparación con los modelos existentes, y su tamaño se reduce a un nivel de 1 bit, lo que le permite funcionar de manera eficiente en las CPU y la memoria de dispositivos pequeños como teléfonos inteligentes y tabletas.

Además, el prisma evalúa con precisión en qué información local de IA confía e incorpora, incluso en situaciones en las que existe una variabilidad significativa en los datos y el rendimiento en diferentes IA locales, lo que resulta en resultados generados de alta calidad.

Por ejemplo, al transformar una selfie en una imagen de estilo de estudio de Studio, los métodos anteriores requirieron cargar la foto a un servidor, lo que plantea preocupaciones sobre posibles violaciones de privacidad. Con el prisma, todo el procesamiento ocurre en el teléfono inteligente, salvaguardando la privacidad personal y permitiendo resultados rápidos. Sin embargo, es importante tener en cuenta que desarrollar el modelo de IA local capaz de generar imágenes en el teléfono inteligente es un requisito separado.

Los resultados experimentales en los conjuntos de datos comúnmente utilizados para validar el rendimiento de la IA, incluidos MNIST, FMNIST, Celeba y CIFAR10, demostraron que el prisma no solo redujo el volumen de comunicación sino que también produjo una generación de imágenes de mayor calidad en comparación con los métodos tradicionales. En particular, los experimentos adicionales que utilizan el conjunto de datos MNIST confirmaron la compatibilidad con modelos de difusión utilizados principalmente para generar imágenes de estilo Gibli Studio.

El equipo de investigación mejoró la eficiencia de la comunicación al emplear un método de máscara binaria estocástica que comparte selectivamente solo información crítica en lugar de un gran intercambio de parámetros. Además, el uso de la discrepancia media máxima (MMD) para la evaluación precisa de la calidad generativa y las estrategias de agregación dinámica consciente de la máscara (MADA) que agregan contribuciones de cada IA ​​local ayudaron de manera diferente a mitigar las discrepancias de datos e inestabilidad de capacitación.

El profesor Yoo declaró: «Nuestro enfoque se puede aplicar no solo a la generación de imágenes, sino también a la generación de texto, la simulación de datos y la documentación automatizada, lo que lo convierte en una solución efectiva y segura en los campos que se ocupan de información confidencial, como la atención médica y las finanzas».

Esta investigación se realizó en colaboración con el profesor Dong-Jun Han de la Universidad de Yonsei, con el investigador unist Kyeongkook SEO participando como el primer autor.

Los resultados de la investigación se presentarán en la Decimotercera Conferencia Internacional sobre Representaciones de Aprendizaje (ICLR 2025) celebrado del 24 al 28 de abril en Singapur.

Más información:
Kyeongkook Seo et al, Prism: preservación de la privacidad mejorado estocástico para modelos generativos federados, arxiv (2025). Doi: 10.48550/arxiv.2503.08085

Información en el diario:
arxiv


Proporcionado por el Instituto Nacional de Ciencia y Tecnología de Ulsan


Citación: El modelo de IA liviano facilita la generación de imágenes de alta calidad sin transmisión directa de datos confidenciales (2025, 14 de abril) Recuperado el 14 de abril de 2025 de https://techxplore.com/news/2025-04-lightweight-ai-hiant- quality-image.html

Este documento está sujeto a derechos de autor. Además de cualquier trato justo con el propósito de estudio o investigación privada, no se puede reproducir ninguna parte sin el permiso por escrito. El contenido se proporciona solo para fines de información.



Fuente

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

GIPHY App Key not set. Please check settings

65525

Obtenga el iPad más nuevo de Apple por $ 20 en Amazon

Speedrunners tendrá un día de campo con nudillos blancos, aunque a veces me alegrará no perder un asidero.

Este juego de plataformas de terror no es para aquellos con miedo a las alturas