Durante la última década, las cámaras digitales han sido ampliamente adoptadas en varios aspectos de nuestra sociedad y se utilizan masivamente en teléfonos móviles, vigilancia de seguridad, vehículos autónomos y reconocimiento facial. A través de estas cámaras, se generan enormes cantidades de datos de imágenes, lo que genera una creciente preocupación sobre la protección de la privacidad.
Algunos métodos existentes abordan estas preocupaciones mediante la aplicación de algoritmos para ocultar información confidencial de las imágenes adquiridas, como el desenfoque o el cifrado de imágenes. Sin embargo, dichos métodos aún corren el riesgo de exponer datos confidenciales porque las imágenes sin procesar ya se capturan antes de que se sometan a procesamiento digital para ocultar o cifrar la información confidencial. Además, el cálculo de estos algoritmos requiere un consumo de energía adicional. También se hicieron otros esfuerzos para buscar soluciones a este problema mediante el uso de cámaras personalizadas para degradar la calidad de la imagen para que se pueda ocultar la información identificable. Sin embargo, estos enfoques sacrifican la calidad general de la imagen para todos los objetos de interés, lo que no es deseable, y siguen siendo vulnerables a los ataques de los adversarios para recuperar la información confidencial que se registra.
Un nuevo trabajo de investigación publicado en eLuz demostró un nuevo paradigma para lograr imágenes que preservan la privacidad mediante la construcción de un tipo fundamentalmente nuevo de generador de imágenes diseñado por IA. En su artículo, los investigadores de la UCLA, dirigidos por el profesor Aydogan Ozcan, presentaron un diseño de cámara inteligente que toma imágenes solo de ciertos tipos de objetos deseados, mientras que instantáneamente borra otros tipos de objetos de sus imágenes sin requerir ningún procesamiento digital.
Este nuevo diseño de cámara consta de superficies transmisivas sucesivas, cada una compuesta por decenas de miles de características de difracción a la escala de la longitud de onda de la luz. La estructura de estas superficies transmisivas se optimiza mediante el aprendizaje profundo para modular la fase de los campos ópticos transmitidos de modo que la cámara solo tome imágenes de ciertos tipos/clases de objetos deseados y borre los demás. Después de su diseño (entrenamiento) basado en el aprendizaje profundo, las capas resultantes se fabrican y ensamblan en 3D, formando la cámara inteligente. Después de su ensamblaje, cuando los objetos de entrada de las clases de objetos de destino aparecen frente a él, forman imágenes de alta calidad en la salida de la cámara, como se desee. Por el contrario, cuando los objetos de entrada frente a la misma cámara pertenecen a otras clases no deseadas, se borran ópticamente, formando patrones no informativos y de baja intensidad similares al ruido aleatorio.
Dado que la información característica de las clases de objetos no deseadas se borra ópticamente en la salida de la cámara a través de la difracción de la luz, esta cámara diseñada por IA nunca graba sus imágenes directas. Por lo tanto, la protección de la privacidad se maximiza ya que un ataque adversario que tenga acceso a las imágenes grabadas de esta cámara no puede recuperar la información. Esta función también puede reducir la carga de almacenamiento y transmisión de datos de las cámaras, ya que las imágenes de objetos no deseados no se graban.
Para demostrar experimentalmente esta cámara única de datos específicos, el equipo de investigación de la UCLA la diseñó para obtener una imagen específica y selectiva de solo una clase de dígitos escritos a mano, y fabricó la cámara diseñada mediante impresión 3D. Esta cámara impresa en 3D se probó utilizando ondas de terahercios que iluminan dígitos escritos a mano. Siguiendo los principios básicos de su diseño, la cámara inteligente pudo capturar selectivamente los objetos de entrada solo si eran dígitos escritos a mano «2», mientras borraba instantáneamente todos los demás dígitos escritos a mano de las imágenes de salida, produciendo características similares a ruido de baja intensidad. .
Además de los dígitos escritos a mano, los investigadores de la UCLA también demostraron otra variación del mismo diseño de cámara específico de clase mediante la captura de imágenes selectivas de un tipo de producto de moda (por ejemplo, pantalones), mientras borraban instantáneamente otros productos de moda de la salida de la cámara. El equipo de investigación probó rigurosamente el diseño de su cámara bajo diversas condiciones de iluminación que nunca se incluyeron en su capacitación y demostró que esta cámara inteligente es resistente a las variaciones de iluminación.
Más allá de las imágenes específicas de la clase de datos, este diseño de cámara basado en IA también se utilizó para construir cámaras de encriptación, proporcionando una capa adicional de seguridad y protección de la privacidad. Una cámara de encriptación de este tipo, diseñada con capas de difracción optimizadas por IA, realiza ópticamente una transformación lineal seleccionada, exclusivamente para los objetos objetivo de interés. Solo aquellos con acceso a la clave de descifrado (es decir, la transformación lineal inversa en este caso) pueden recuperar la imagen original de los objetos de destino. Por otro lado, la información de los otros objetos no deseados se pierde de forma irreversible ya que la cámara diseñada por IA los borra ópticamente en la salida. Por lo tanto, incluso si la clave de descifrado se aplica a las imágenes grabadas, produce características irreconocibles similares a ruido para otras clases de objetos no deseados.
A excepción de la luz de iluminación, esta cámara inteligente no requiere ninguna fuente de alimentación externa para su cálculo y funciona a la velocidad de la luz. Por lo tanto, es rápido, eficiente en el uso de datos y energía, lo que lo hace especialmente adecuado para aplicaciones de imágenes de tareas específicas, con privacidad y energía limitada. Las enseñanzas centrales de este diseño de cámara difractiva pueden inspirar futuros sistemas de imágenes que consuman órdenes de magnitud menos de potencia informática y de transmisión de datos.
Esta investigación fue dirigida por el profesor Aydogan Ozcan, director asociado del Instituto de Nanosistemas de California (CNSI) y la Cátedra Volgenau de Innovación en Ingeniería en el departamento de Ingeniería Eléctrica e Informática (ECE) de la UCLA, junto con la profesora Mona Jarrahi, Northrop Grumman Endowed Presidente y director del Laboratorio de Electrónica de Terahertz en UCLA ECE. Los otros autores de este trabajo incluyen a los estudiantes de posgrado Bijie Bai, Yi Luo, Tianyi Gan, Yuhang Li, Yifan Zhao, Deniz Mengu y al investigador postdoctoral Dr. Jingtian Hu, todos del departamento de ECE en UCLA.
Bijie Bai et al, To image, or not to image: cámaras difractivas específicas de clase con borrado totalmente óptico de objetos no deseados, eLuz (2022). DOI: 10.1186/s43593-022-00021-3
Citación: La cámara diseñada por IA solo graba objetos de interés mientras no ve a los demás (2022, 15 de agosto) recuperado el 15 de agosto de 2022 de https://techxplore.com/news/2022-08-ai-designed-camera.html
Este documento está sujeto a derechos de autor. Aparte de cualquier trato justo con fines de estudio o investigación privados, ninguna parte puede reproducirse sin el permiso por escrito. El contenido se proporciona únicamente con fines informativos.