
Enfoques de reconocimiento del habla. Crédito: Naturaleza (2025). Doi: 10.1038/s41586-025-09501-1
Reconocimiento de voz sin software pesado o procesadores hambrientos de energía: los investigadores de la Universidad de Twente, junto con IBM Research Europe y Toyota Motor Europe, presentan un enfoque completamente nuevo. Sus chips permiten que el material en sí «escuche». El publicación por el profesor Wilfred van der Wiel y sus colegas aparecen hoy en Naturaleza.
Hasta ahora, el reconocimiento de voz se ha basado en servidores en la nube y un software complejo. Los investigadores de Twente muestran que se puede hacer de manera diferente. Combinaron una unidad de procesamiento no lineal reconfigurable (RNPU), desarrollada en la Universidad de Twente, con un nuevo chip IBM. Juntos, estos dispositivos procesan suenan tan suave y dinámicamente como el oído y el cerebro humanos. En las pruebas, este enfoque resultó al menos tan preciso como los mejores modelos de software, y a veces incluso mejor.
El impacto potencial es considerable: los audífonos que casi no usan energía, asistentes de voz que ya no envían datos a la nube o automóviles con control directo del habla. «Esta es una nueva forma de pensar sobre la inteligencia en el hardware», dice el profesor Van der Wiel. «Mostramos que el material en sí puede ser entrenado para escuchar».
Más allá del habla
La tecnología no se limita al habla. En principio, puede procesar cualquier señal dependiente del tiempo. Video, imágenes o transmisiones de datos continuos de sensores son igualmente adecuados. Imagine sensores que miden constantemente su entorno y pueden responder de forma autónoma, sin necesidad de una batería nueva cada pocos días o depender en gran medida de una conexión a Internet. Muchas tareas computacionales se pueden llevar a cabo a nivel local y energético, lo que hace que los dispositivos sean más inteligentes y más independientes.
El mismo principio también podría usarse para acelerar las tareas exigentes de IA. Las partes específicas de los algoritmos complejos podrían integrarse directamente en materiales, aliviando la carga en chips convencionales. Este enfoque híbrido permitiría que los circuitos digitales tradicionales funcionen en conjunto con componentes en la materia que manejan ciertas tareas de manera mucho más eficiente.

Esquema de una arquitectura CNN híbrida para el reconocimiento de voz en materia. Crédito: Naturaleza (2025). Doi: 10.1038/s41586-025-09501-1
De laboratorio a práctica
Van der Wiel espera que la tecnología no permanezca limitada a los documentos científicos. «Mi sueño es que nuestros chips encontrarán su camino en aplicaciones del mundo real, como los audífonos. Un componente de dicho dispositivo podría basarse en nuestra tecnología».
Esa perspectiva es realista debido a los materiales utilizados. Los chips se basan en silicio estándar y funcionan a temperatura ambiente. Esto hace que sea factible producirlos en las fábricas de semiconductores existentes. «Eso hace que la escala hacia aplicaciones prácticas sea mucho más realista», explica Van Der.
Más información:
Wilfred G. van der Wiel, Reconocimiento analógico de voz basado en la computación física, Naturaleza (2025). Doi: 10.1038/s41586-025-09501-1. www.nature.com/articles/s41586-025-09501-1
Citación: Material que escucha: el enfoque basado en chips permite el reconocimiento de voz y más (2025, 17 de septiembre) recuperado el 17 de septiembre de 2025 de https://techxplore.com/news/2025-09-material-chip basado en abroch-enables.html
Este documento está sujeto a derechos de autor. Además de cualquier trato justo con el propósito de estudio o investigación privada, no se puede reproducir ninguna parte sin el permiso por escrito. El contenido se proporciona solo para fines de información.