in

Se encontraron algoritmos de copia de voz capaces de engañar a los dispositivos de reconocimiento de voz

Alexa

Alexa

Crédito: Pixabay / CC0 Public Domain

Un equipo de investigadores de la Universidad de Chicago ha descubierto que los algoritmos de copia de voz han avanzado hasta el punto de que ahora son capaces de engañar a los dispositivos de reconocimiento de voz y, en muchos casos, a las personas que los escuchan. El grupo ha publicado un documento en el servidor de preimpresión arXiv que describe dos conocidos algoritmos de copia de voz.

Los videos de deepfake son bien conocidos; Muchos ejemplos de lo que solo parecen ser celebridades se pueden ver con regularidad en YouTube. Pero si bien estos videos se han vuelto realistas y convincentes, un área en la que fallan es en la reproducción de la voz de una persona. En este nuevo esfuerzo, el equipo de UoC encontró evidencia de que la tecnología ha avanzado. Probaron dos de los algoritmos de copia de voz más conocidos contra dispositivos humanos y de reconocimiento de voz y descubrieron que los algoritmos han mejorado hasta el punto de que ahora pueden engañar a ambos.

Los dos algoritmosSV2TTS y AutoVC—Fueron probados obteniendo muestras de grabaciones de voz de bases de datos disponibles públicamente. Ambos sistemas se entrenaron utilizando 90 fragmentos de voz de cinco minutos de personas hablando. También contaron con la ayuda de 14 voluntarios que proporcionaron muestras de voz y acceso a sus dispositivos de reconocimiento de voz. Luego, los investigadores probaron los dos sistemas utilizando el software de código abierto Resemblyzer: escucha y compara grabaciones de voz y luego otorga una calificación basada en dos muestras similares. También probaron los algoritmos usándolos para intentar acceder a servicios en dispositivos de reconocimiento de voz.

Los investigadores encontraron que los algoritmos podían engañar al Resemblyzer casi la mitad de las veces. También descubrieron que podían engañar a Azure (el servicio de computación en la nube de Microsoft) aproximadamente el 30 por ciento de las veces. Y pudieron engañar al sistema de reconocimiento de voz Alexa de Amazon aproximadamente el 62% del tiempo.

Doscientos voluntarios también escucharon pares de grabaciones y trataron de determinar si las voces eran de la misma persona; los resultados fueron mixtos, pero en general, los algoritmos pudieron engañar a los voluntarios la mayoría de las veces, y especialmente cuando las muestras de voz eran de gente famosa.







La voz profunda mejorada puede imitar cualquier voz en cuestión de segundos


Más información:
Emily Wenger et al, «Hola, soy yo»: Ataques de síntesis de voz basados ​​en aprendizaje profundo en el mundo real. arXiv: 2109.09598v1 [cs.CR], arxiv.org/abs/2109.09598

© 2021 Science X Network

Citación: Se encontraron algoritmos de copia de voz capaces de engañar a los dispositivos de reconocimiento de voz (2021, 13 de octubre) recuperado el 24 de octubre de 2021 de https://techxplore.com/news/2021-10-voice-algorithms-dupe-recognition-devices.html

Este documento está sujeto a derechos de autor. Aparte de cualquier trato justo con fines de estudio o investigación privados, no se puede reproducir ninguna parte sin el permiso por escrito. El contenido se proporciona únicamente con fines informativos.



Fuente

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

GIPHY App Key not set. Please check settings

Free Fire: códigos de canje gratuitos del 24 de octubre (2021)

Free Fire: códigos de canje gratuitos del 24 de octubre (2021)

EXPLICADOR: Qué es el metaverso y cómo funcionará

Que es el metaverso y como funcionará