A medida que se difunden las aplicaciones de la inteligencia artificial, se debe realizar más computación, y de manera más eficiente con un menor consumo de energía, en dispositivos locales en lugar de en centros de datos geográficamente distantes para superar los frustrantes retrasos en la respuesta. Un grupo de ingenieros de la Universidad de Tokio probó por primera vez el uso de materiales ferroeléctricos de óxido de hafnio para la computación de depósitos físicos, un tipo de red neuronal que mapea datos en sistemas físicos y puede lograr precisamente ese avance, en una aplicación de reconocimiento de voz. .
Describieron sus resultados en un documento presentado en el Simposio híbrido IEEE 2022 sobre tecnología y circuitos VLSI, celebrado en Honolulu, Hawái, del 12 al 17 de junio.
El desarrollo de la tecnología de inteligencia artificial (IA) y sus innumerables aplicaciones se ha disparado en los últimos años, pero una barrera importante para su mayor implementación proviene del enorme costo de computación y el consumo de energía, especialmente cuando dicha computación se lleva a cabo mediante un software cuya ubicación física se encuentra en los datos. centra a una distancia considerable del usuario.
Incluso cuando los datos viajan a través de las redes a la velocidad de la luz, puede haber demoras de fracciones de segundo o más entre la solicitud de un usuario y la entrega de la respuesta de una aplicación. Esto se debe a las grandes distancias a medida que los fotones viajan desde el usuario hasta el centro de datos, a veces a medio globo de distancia, y luego regresan. Para aplicaciones de consumo, desde videojuegos hasta asistentes de voz, este pequeño retraso puede ser frustrante, pero para aplicaciones de misión crítica en el gobierno, desde atención médica hasta defensa, tales retrasos, conocidos como latencia, pueden costar vidas.
Los ingenieros y científicos informáticos se centran en dos líneas de ataque con respecto a la superación de este desafío: cambiar al menos parte de la computación requerida del software al hardware, y de los centros de datos centralizados, o la nube, a un dispositivo local.
La primera estrategia es necesaria porque no tiene sentido intentar solo ganancias de eficiencia en los programas que uno está ejecutando y no también en las máquinas en las que se ejecutan. La segunda estrategia, conocida como computación perimetral, reduce la latencia ya que simplemente hay menos distancia para que viajen los datos. Cuando su teléfono inteligente realiza los cálculos involucrados en una verificación biométrica (y no el centro de datos a cierta distancia), este es un ejemplo de la dispersión del cálculo de la computación perimetral desde la nube hasta el dispositivo.
Últimamente, la computación de reservorios físicos (PRC), en la que se logran ganancias de eficiencia en el hardware del dispositivo local, ha atraído mucho la atención de los investigadores de ingeniería por su capacidad para avanzar en estas dos líneas de ataque. PRC es una consecuencia del desarrollo de redes neuronales recurrentes (RNN), un tipo de aprendizaje automático que se adapta bien al procesamiento de datos a lo largo del tiempo (datos temporales) en lugar de datos estáticos. Esto se debe a que las RNN tienen en cuenta la información de entradas anteriores para considerar una entrada actual (por lo tanto, «recurrente») y, a partir de ahí, la salida. Debido a esta capacidad de tratar con datos temporales, las RNN son adecuadas para aplicaciones cuyas conclusiones (o inferencias) son sensibles a la secuencia de los datos o al contexto basado en el tiempo, como el reconocimiento de voz, el procesamiento del lenguaje natural o la traducción de idiomas, y las utilizan aplicaciones como como Google Traductor o Siri.
En la computación de reservorios físicos, los datos de entrada se asignan a patrones en algún sistema físico o reservorio (como los patrones en la estructura de un material magnético, un sistema de fotones o un dispositivo mecánico), que disfruta de un espacio dimensional más alto que la entrada (Un trozo de papel es un espacio que tiene una dimensión más alta que un trozo de cuerda, y una caja tiene una dimensión más que el trozo de papel). Luego, se realiza un análisis de patrones en los patrones espacio-temporales en la lectura final. «capa» para comprender el estado del yacimiento. Debido a que la IA no está entrenada en las conexiones recurrentes dentro del depósito, sino solo en la lectura, se pueden lograr algoritmos de aprendizaje más simples, lo que reduce drásticamente el cálculo requerido, permite el aprendizaje de alta velocidad y reduce el consumo de energía.
Los ingenieros de la Universidad de Tokio habían ideado anteriormente una nueva arquitectura PRC que utiliza transistores de puerta ferroeléctrica (FeFET) hechos de materiales ferroeléctricos a base de óxido de hafnio. La mayoría de la gente está familiarizada con el ferromagnetismo, en el que un imán de hierro se magnetiza permanentemente en una dirección polar particular (una parte del imán se convierte en su «norte» y el otro extremo en su «sur»). La ferroelectricidad implica un fenómeno análogo en el que ciertos materiales, en este caso el óxido de hafnio y el óxido de circonio, experimentan una polarización eléctrica (un cambio de carga eléctrica positiva y negativa) que posteriormente puede revertirse mediante la aplicación de un campo eléctrico externo. Esta polarización conmutable puede almacenar memoria como cualquier transistor. En 2020, los investigadores también demostraron que era posible una operación básica de computación de yacimientos utilizando estos materiales.
«Estos materiales ya se usan comúnmente en los procesos de fabricación de circuitos integrados de semiconductores», dijo Shinichi Takagi, coautor del artículo y profesor del Departamento de Ingeniería Eléctrica y Sistemas de Información de la Universidad de Tokio. «Esto significa que se espera que los depósitos de FeFET se integren con la fabricación de circuitos integrados de semiconductores a gran escala con poca dificultad en comparación con algunos materiales más novedosos».
Si bien los materiales ferroeléctricos basados en óxido de hafnio habían recibido mucha atención en la industria de los semiconductores debido a su ferroelectricidad, aún no se había investigado para qué tipo de aplicaciones era adecuada la computación de reservorios físicos basada en FeFET y qué tan bien funcionaba en aplicaciones reales.
Habiendo demostrado que su arquitectura PRC era factible hace dos años, los investigadores la probaron en una aplicación de reconocimiento de voz. Descubrieron que tenía una precisión del 95,9 % para el reconocimiento de voz de los números del cero al nueve. Esto demostró por primera vez la usabilidad de la tecnología en una aplicación del mundo real.
Los investigadores ahora quieren ver si pueden aumentar el rendimiento informático de sus depósitos FeFET, además de probarlos en otras aplicaciones.
En última instancia, los investigadores esperan demostrar que un chip de IA con la arquitectura PRC ferroeléctrica basada en óxido de hafnio puede lograr un alto nivel de rendimiento en términos de consumo de energía extremadamente bajo y procesamiento en tiempo real en comparación con los métodos y hardware de cálculo de IA convencionales.
Creación de nueva memoria de almacenamiento de datos
E. Nako, K. Toprasertpong, R. Nakane, M. Takenaka y S. Takagi, «Demostración experimental del nuevo esquema de computación de depósito HZO/Si FeFET con procesamiento paralelo de datos para reconocimiento de voz», Simposio IEEE 2022 sobre tecnología VLSI y Circuitos: 12 al 17 de junio de 2022.
Conferencia: www.vlsisymposium.org/
Citación: La nueva arquitectura de hardware proporciona una ventaja en la computación de IA (2022, 13 de junio) consultado el 20 de junio de 2022 en https://techxplore.com/news/2022-06-hardware-architecture-edge-ai.html
Este documento está sujeto a derechos de autor. Aparte de cualquier trato justo con fines de estudio o investigación privados, ninguna parte puede reproducirse sin el permiso por escrito. El contenido se proporciona únicamente con fines informativos.