¿Qué pasaría si una cámara de seguridad no sólo pudiera capturar video sino también entender lo que está sucediendo, distinguiendo entre actividades rutinarias y comportamientos potencialmente peligrosos en tiempo real? Ese es el futuro que están moldeando los investigadores de la Facultad de Ingeniería y Ciencias Aplicadas de la Universidad de Virginia con su último avance: un analizador de vídeo inteligente impulsado por IA capaz de detectar acciones humanas en secuencias de vídeo con una precisión e inteligencia sin precedentes.
El trabajo de investigación es publicado en el diario Transacciones IEEE sobre análisis de patrones e inteligencia artificial.
El sistema, llamado Red de Transformadores Espaciotemporales Semánticos y Conscientes del Movimiento (SMAST), promete una amplia gama de beneficios sociales, desde mejorar los sistemas de vigilancia y la seguridad pública hasta permitir un seguimiento de movimiento más avanzado en la atención médica y refinar la forma en que los vehículos autónomos navegan a través de complejos ambientes.
«Esta tecnología de IA abre puertas a la detección de acciones en tiempo real en algunos de los entornos más exigentes», afirmó el profesor y presidente del Departamento de Ingeniería Eléctrica e Informática, Scott T. Acton, e investigador principal del proyecto. «Es el tipo de avance que puede ayudar a prevenir accidentes, mejorar el diagnóstico e incluso salvar vidas».
Innovación impulsada por la IA para análisis de vídeo complejos
Entonces, ¿cómo funciona? En esencia, SMAST funciona con inteligencia artificial. El sistema se basa en dos componentes clave para detectar y comprender comportamientos humanos complejos. El primero es un modelo de atención selectiva con múltiples funciones, que ayuda a la IA a centrarse en las partes más importantes de una escena, como una persona o un objeto, ignorando detalles innecesarios. Esto hace que el sistema sea más preciso a la hora de identificar lo que está sucediendo, como reconocer a alguien que lanza una pelota en lugar de simplemente mover el brazo.
La segunda característica clave es un algoritmo de codificación posicional 2D sensible al movimiento, que ayuda a la IA a rastrear cómo se mueven las cosas a lo largo del tiempo. Imagínese ver un video en el que las personas cambian constantemente de posición; esta herramienta ayuda a la IA a recordar esos movimientos y comprender cómo se relacionan entre sí. Al integrar estas funciones, SMAST puede reconocer con precisión acciones complejas en tiempo real, lo que lo hace más efectivo en escenarios de alto riesgo como vigilancia, diagnóstico de atención médica o conducción autónoma.
SMAST redefine cómo las máquinas detectan e interpretan las acciones humanas. Los sistemas actuales luchan con secuencias de vídeo contiguas, caóticas y sin editar, a las que a menudo les falta el contexto de los acontecimientos. Pero el diseño innovador de SMAST le permite capturar las relaciones dinámicas entre personas y objetos con una precisión notable, impulsado por los propios componentes de IA que le permiten aprender y adaptarse a partir de los datos.
Estableciendo nuevos estándares en tecnología de detección de acciones
Este salto tecnológico significa que el sistema de IA puede identificar acciones como un corredor que cruza una calle, un médico realizando un procedimiento preciso o incluso una amenaza a la seguridad en un espacio concurrido. SMAST ya ha superado a las soluciones de primer nivel en puntos de referencia académicos clave, incluidos AVA, UCF101-24 y EPIC-Kitchens, estableciendo nuevos estándares de precisión y eficiencia.
«El impacto social podría ser enorme», afirmó Matthew Korban, investigador postdoctoral asociado en el laboratorio de Acton que trabaja en el proyecto. «Estamos entusiasmados de ver cómo esta tecnología de IA podría transformar las industrias, haciendo que los sistemas basados en video sean más inteligentes y capaces de comprender en tiempo real».
Más información:
Matthew Korban et al, Una red transformadora espaciotemporal semántica y consciente del movimiento para la detección de acciones, Transacciones IEEE sobre análisis de patrones e inteligencia artificial (2024). DOI: 10.1109/TPAMI.2024.3377192
Citación: El analizador de vídeo impulsado por IA establece nuevos estándares en la detección de acciones humanas (2024, 16 de octubre) recuperado el 16 de octubre de 2024 de https://techxplore.com/news/2024-10-ai-driven-video-standards-human.html
Este documento está sujeto a derechos de autor. Aparte de cualquier trato justo con fines de estudio o investigación privados, ninguna parte puede reproducirse sin el permiso por escrito. El contenido se proporciona únicamente con fines informativos.
GIPHY App Key not set. Please check settings