in

La tecnología de conversión de texto a voz ayuda a producir más audiolibros para personas ciegas o con problemas de visión

Una mujer muestra objetos a un grupo de niños.
El fundador de Hongdandan, Zheng Xiaojie, comparte algunos audiolibros con un grupo de escolares.

Actualmente, la biblioteca distribuye contenido a través de Microsoft Azure en 105 escuelas de China para estudiantes ciegos o con problemas de visión. También pueden acceder a más de 1.000 títulos en la propia aplicación de la biblioteca y a un miniprograma en WeChat, la popular plataforma de redes sociales de China.

Microsoft ha sido socio de Hongdandan durante unos 15 años. Y el centro produce sus audiolibros de acuerdo con El compromiso de Microsoft con la IA responsable, que protege contra el uso indebido de la tecnología y prioriza la transparencia, la equidad, la responsabilidad, la privacidad y la seguridad.

«Microsoft ha estado en contacto con nosotros todo el tiempo», dice Zheng. “Apoyar todos los aspectos de la biblioteca Eyes of the Soul, incluido el servicio de voz de IA que estamos usando ahora, que antes era inimaginable para nosotros. En los trabajos de primera línea, conocíamos las necesidades de las personas ciegas, pero no sabíamos cómo utilizar métodos de alta tecnología para resolver sus necesidades. De hecho, la tecnología es un método particularmente bueno para la educación de personas ciegas o con baja visión. Nos acerca más «.

LEA TAMBIÉN: ¿Me estás hablando? Azure AI da vida a personajes icónicos con Custom Neural Voice

Además de la docencia y el voluntariado, Dong se encuentra actualmente en un programa de posgrado en la Universidad de Comunicación de China, donde investiga la creación y el uso de voces sintéticas. «Como persona ciega, el desarrollo de la tecnología ha cambiado mi vida», dice.

Entonces, con su experiencia y su oído atento a las voces, ¿cómo califica las creaciones de inteligencia artificial de Microsoft, incluida la suya propia?

“La Voz Neural Personalizada de Microsoft en realidad simula una voz real mucho mejor que las voces sintéticas más generales”, dice ella. «Por ejemplo, hay algunos cambios de tono y más detalles en el voces: estas los detalles son realmente buenos «.

Dong dice que, ya sea real o sintética, una voz de audio ideal debe sonar cálida y clara, con un sentido de confianza e incluso un sentimiento de amor y afecto. “El punto más similar entre una voz humana y la Voz neuronal personalizada de Microsoft es el timbre — el El timbre de la Voz neuronal personalizada es realmente vívido «.

Tanto Dong como Zheng enfatizan la importancia de la Biblioteca Ojos del Alma para mejorar las perspectivas de educación y empleo de las personas ciegas o con baja visión. Pero también ven otro beneficio crucial: un sentido de conexión que infunde confianza y autosuficiencia.

Zheng dice que muchas personas ciegas o con problemas de visión pueden ahora “aprovechar las oportunidades en la era de Internet y encontrar las profesiones y posiciones en las que son buenos.

“Les damos un canal para adquirir conocimientos y conocer el mundo. Tener la compañía de una voz ha eliminado la distancia entre ellos y el mundo, por lo que muchos se han vuelto más positivos y confiados. Ya no tienen una sensación de aislamiento o miedo al mundo. Creen que pueden hacer muchas cosas por sí mismos «.

Todas las imágenes son cortesía del Centro de Servicio para Personas con Discapacidades Visuales de Hongdandan. ARRIBA: Lina Dong en una cabina de grabación. CENTRO: Lisa Dong (centro) dirige una lección con los estudiantes.



Fuente

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

GIPHY App Key not set. Please check settings

65525

Global 500 2021

Apple avanza en las clasificaciones de Fortune Global 500

Las puertas de Halo Infinite hacen que los espartanos parezcan gruñidos

Las puertas de Halo Infinite hacen que los espartanos parezcan gruñidos