
Hecho de silicio, estas matrices de procesamiento visual en sensor pueden capturar y procesar datos visuales en el dominio analógico, a diferencia de los sistemas convencionales que a menudo separan físicamente estas funciones. Crédito: Guangyu Xu, Umass Amherst
Investigadores de la Universidad de Massachusetts Amherst han impulsado el desarrollo de la visión por computadora con un nuevo hardware basado en silicio que puede capturar y procesar datos visuales en el dominio analógico. Su trabajo, descrito en el diario Comunicaciones de la naturalezaen última instancia, podría aumentar a las tareas de visión por computadora a gran escala, intensiva en datos y sensible a la latencia.
«Este es un hardware retinomórfico muy poderoso», dice Guangyu Xu, profesor asociado de ingeniería eléctrica e informática y profesor asociado adjunto de ingeniería biomédica en UMass Amherst. «La idea de fusionar la unidad de detección y la unidad de procesamiento a nivel de dispositivo, en lugar de separarlos físicamente, es muy similar a la forma en que los ojos humanos procesan el mundo visual».
Los sistemas de visión por computadora existentes a menudo implican intercambiar datos redundantes entre las unidades de detección y computación separadas físicamente.
«Por ejemplo, la cámara en su teléfono celular captura cada píxel de datos en el campo de visión», dice Xu.
Sin embargo, esa imagen tiene más información de la que el sistema requiere para identificar un objeto o su movimiento. Como resultado, el tiempo que lleva transmitir y procesar esta información adicional introduce un retraso para comprender la información visual capturada, que a menudo es sensible al tiempo e intensiva en datos.
«Nuestra tecnología está tratando de reducir esta latencia entre el momento en que sientes el mundo físico y el momento en que identificas lo que estás capturando», dice.
Xu y su equipo crearon dos matrices integradas de fotodetectores de silicio ajustables para la puerta, o matrices de procesamiento visual en el sentido. Compartiendo la salida analógica bipolar y la operación de baja potencia, una matriz puede capturar información visual dinámica, como los cambios de luz basados en eventos, y uno puede capturar las características espaciales en imágenes estáticas para identificar cuál es el objeto.

Reconocer los movimientos humanos en entornos sofisticados es un desafío clásico de visión por computadora. Xu y sus colegas descubrieron que su tecnología analógica era capaz de realizar la tarea con una precisión del 90%, superando a sus homólogos digitales. Crédito: Guangyu Xu, Umass Amherst
La ampliación de estas matrices de silicio es prometedora para la computación retinomórfica y la detección de inteligencia. Para los movimientos dinámicos, cuando se le pide que clasifiquen los movimientos humanos (caminar, boxear, ondear y aplazar) en entornos sofisticados, la nueva tecnología analógica era precisa el 90% del tiempo, mientras que las contrapartes digitales fueron del 77.5 a 85% precisa. Para las imágenes estáticas, su tecnología clasificó números escritos a mano con una precisión del 95%, lo que supera los métodos sin capacidades informáticas de sensor (90%).
Una característica única de estas matrices es que están hechas de silicio, el mismo material utilizado en chips de computadora, en contraste con procesadores visuales previos en sensor que en su mayoría están hechos de nanomateriales. Como tal, estas matrices son más compatibles con el metal -óxido -semiconductores (CMOS) complementario existente, la tecnología de semiconductores más utilizada utilizada para construir circuitos integrados en una amplia gama de dispositivos electrónicos, como computadoras y chips de memoria. Esta compatibilidad los hace únicos adecuados para tareas de visión por computadora a gran escala, en las que muchos procesos se ejecutan simultáneamente, también conocidos como alto paralelismo.
«Nuestra tecnología All-Silicon se presta a la integración de CMOS, la producción en masa y la operación de matriz a gran escala con bajas variabilidades, por lo que creo que es un gran salto en este campo», dice Xu.
Xu ofrece ejemplos concretos de aplicaciones potenciales para este trabajo. Primero son los vehículos autónomos: «Siempre tienes que, en tiempo real, procesar lo que rodea tu vehículo y qué tan rápido se mueven», dice. Cualquier reducción en el tiempo de procesamiento aumenta la seguridad de los vehículos autónomos.
Otra área que se beneficiará es la bioimagen. La tecnología actual puede capturar más datos de los que realmente se necesita.
«Quizás podamos comprimir la cantidad de datos y dar la misma visión biológica para los científicos», dice Xu.
Más información:
Zheshun Xiong et al, paralelizando el procesamiento visual analógico en sensor con matrices de fotodetectores de silicio ajustables para la puerta, Comunicaciones de la naturaleza (2025). Doi: 10.1038/s41467-025-60006-x
Citación: Nuevo hardware de visión por computadora All-Silicon avanza la tecnología de procesamiento visual en el sentido (2025, 18 de junio) Recuperado el 25 de julio de 2025 de https://techxplore.com/news/2025-06-silicon-vision-hardware-vances-sensor.html
Este documento está sujeto a derechos de autor. Además de cualquier trato justo con el propósito de estudio o investigación privada, no se puede reproducir ninguna parte sin el permiso por escrito. El contenido se proporciona solo para fines de información.