in

Fusión de características físicas y fisiológicas para la detección automática de suplantación de identidad por voz

Fusión de características físicas y fisiológicas para la detección automática de suplantación de identidad por voz

La estructura del modelo propuesto. Crédito: Revistas Frontiers

Los sistemas biométricos de reconocimiento de voz a menudo están sujetos a varios ataques de suplantación de identidad, los más comunes son los ataques de síntesis de voz y de conversión de voz. Estos ataques de suplantación de identidad pueden hacer que el sistema de reconocimiento de voz biométrico acepte de forma incorrecta estos ataques de suplantación de identidad, lo que puede comprometer la seguridad de este sistema. Los investigadores han hecho muchos esfuerzos para abordar este problema. Pero los métodos de detección de suplantación de voz existentes solo tienen en cuenta las características físicas del habla, lo que da como resultado un rendimiento de detección deficiente.

Para resolver el problema, un equipo de investigación dirigido por Junxiao Xue publicó su nueva investigación el 27 de marzo de 2023 en Fronteras de la informática.

El equipo propuso un método de detección de suplantación de voz basado en la fusión de características físicas y fisiológicas. El método incluía un extractor de características, una red neuronal convolucional densamente conectada con bloques de compresión y excitación (SE-DenseNet) y una estrategia de fusión de características. En comparación con los métodos existentes, la función de costo de decisión en tándem y las puntuaciones de tasa de error igual mejoraron en un 5 % y un 7 %, respectivamente.

Específicamente, las características fisiológicas del audio se extrajeron primero de una red convolucional previamente entrenada. Luego se usó SE-DenseNet para extraer las características físicas. Un modelo tan densamente conectado tenía una alta eficiencia paramétrica y los bloques de compresión y excitación mejoraron la eficiencia de la transmisión de características. Finalmente, las dos funciones se integraron en la red de clasificación para la detección de suplantación de identidad por voz.

Compararon el modelo propuesto con algunos de los mejores sistemas individuales. Los experimentos mostraron que su modelo propuesto funciona mejor tanto en EER como en t-DCF. Para validar la eficacia de los rasgos faciales, también evaluaron el rendimiento de algunos modelos de referencia que introdujeron rasgos faciales. Se encontró que diferentes métodos de línea de base mostraron diferentes grados de mejora en el rendimiento cuando se combinaron con las características de la cara, lo que demuestra que las características de la cara son practicables para los modelos de línea de base.

El trabajo futuro puede intentar extraer características faciales más precisas y estudiar estrategias de fusión de características más efectivas para detectar ataques de suplantación de identidad.

Más información:
Junxiao Xue et al, Fusión de características físicas y fisiológicas para la detección automática de suplantación de voz, Fronteras de la informática (2022). DOI: 10.1007/s11704-022-2121-6

Proporcionado por Frontiers Journals

Citación: Fusión de características físicas y fisiológicas para la detección automática de suplantación de voz (15 de mayo de 2023) consultado el 15 de mayo de 2023 en https://techxplore.com/news/2023-05-physiological-physical-feature-fusion-automatic-voice.html

Este documento está sujeto a derechos de autor. Aparte de cualquier trato justo con fines de estudio o investigación privados, ninguna parte puede reproducirse sin el permiso por escrito. El contenido se proporciona únicamente con fines informativos.



Fuente

Francia investiga a Apple por supuesta ‘obsolescencia planificada’ derivada de piezas de reparación serializadas

Cómo Tomar Fotos Lágrimas Del Reino

Cómo tomar fotos en Tears of the Kingdom