Microsoft está ayudando a remodelar la industria automotriz en la forma en que sirve a sus conductores con sistemas de información y entretenimiento en el vehículo. Por ejemplo, Azure se está asociando con XPeng para habilitar experiencias de voz de inteligencia artificial para marcas y clientes automotrices. La solución proporciona a la industria una nueva versión de la conversión de texto a voz y la voz expresiva, los idiomas globales, la fidelidad del hablante y la personalización de autoservicio. XPeng se une a una tendencia creciente de fabricantes de automóviles que reconsideran las inversiones en la voz ambiental.
«Esta es una exploración de vanguardia de la interacción de voz de vehículos en la industria automotriz», dijo el experto senior en productos de IA automotriz de Xpeng, Hao Chao. “La experiencia ofrece un nivel completamente nuevo de habla natural. Con un profundo conocimiento de la movilidad urbana, estamos encontrando muchos más escenarios para aprovechar la tecnología de IA para un alto nivel de intuición conductor-máquina «.
XPeng aprovechó la tecnología neuronal de texto a voz de Microsoft para su experiencia de usuario en el automóvil. Al utilizar la conversión neuronal de texto a voz de Microsoft con estilos emocionales, Xpeng puede proporcionar una experiencia auditiva más agradable a sus clientes y combatir la fatiga auditiva. La conversión neuronal de texto a voz de Microsoft proporciona una fluidez y una naturalidad comparable a la de una voz humana. Junto con las voces multiemocionales, la conversión de texto a voz de Microsoft actúa como un reemplazo refrescante del sonido monótono que muchos asistentes de automóviles tienen hoy en día.
«Estamos entusiasmados de reimaginar cómo el habla y la voz pueden mejorar la vida de los conductores», dijo Binggong Ding, líder de productos de voz de Azure AI. y sus desarrolladores. ¿Cómo podemos optimizar mejor el uso de voz sintética para permitir una experiencia de voz de alta fidelidad sin comprometer la calidad del sonido? XPeng se basa en este desafío para proporcionar un asistente de voz que los clientes estaban buscando «
El objetivo a largo plazo de Microsoft es hacer de las capacidades de voz globales y multiemocionales avanzadas el nuevo estándar para las marcas y los consumidores mundiales de automóviles. La tecnología adoptada por XPeng agregó docenas de estilos de voz, control único de la intensidad emocional y habilidades de deducción. Cubre 90 certificaciones en todo el mundo, incluidas las políticas nacionales, los requisitos reglamentarios del centro de datos y el RGPD de la UE, y los requisitos más altos para los titulares de políticas de privacidad de datos. Junto con los fabricantes de automóviles, Microsoft está creando nuevas experiencias de conducción con voz basada en las capacidades de conversión de texto a voz y de voz a texto dentro de Azure Cognitive Services para voz.
Innovación acelerada del habla
Voice es la nueva interfaz en tecnología de computación ambiental. La calidad de la conversión de texto a voz y de voz a texto ha mejorado en los últimos años debido a la investigación y los avances tecnológicos propiciados por el desarrollo de las redes neuronales. La conversión de voz a texto y la conversión de texto a voz de alta calidad satisfacen las necesidades del fabricante de automóviles para crear la experiencia de voz moderna en el automóvil de próxima generación. La conversión de voz a texto de Microsoft ofrece sólidas capacidades de reconocimiento que son independientes del hablante y capaces de manejar el ruido ambiental mientras se conduce. Microsoft text-to-speech también presenta una voz más fluida y con un sonido natural que puede ser una diferenciación tanto para los fabricantes de automóviles como para los clientes. Tanto la conversión de voz a texto como la conversión de texto a voz también aumentan el control de manos libres del sistema de información y entretenimiento del automóvil. La conversión de texto a voz de Microsoft admite varios estilos de habla, incluidos el chat, el noticiero y el servicio al cliente. Estos avances permiten a los conductores tener una experiencia de conducción más agradable. Para obtener más información sobre los avances recientes en la conversión de voz a texto y de texto a voz, consulte dictado a texto con sus resultados de investigación, alcanzar la paridad humana en el punto de referencia de investigación de Switchboard y neural-text-to-speech está cerca de la paridad humana.
Ofreciendo idiomas globales
Microsoft ayuda a los fabricantes de automóviles a cubrir su negocio global y recientemente alcanzó un hito de 100 idiomas y ahora admite 119 idiomas y variantes con 278 voces listas para usar. Esto está alineado con la visión de nuestra empresa de capacitar a todas las personas y organizaciones del planeta para que logren más. “Cien idiomas es un buen hito para que logremos nuestra ambición de que todos puedan comunicarse independientemente del idioma que hablen,» dicho Xuedong Huang, Miembro técnico de Microsoft y director de tecnología de Azure AI. Con más idiomas con sus variantes cubiertas, estamos entusiasmados de impulsar experiencias de voz naturales e intuitivas para los fabricantes de automóviles.
Diferenciación con personalización
Microsoft permite a los fabricantes de automóviles desarrollar una voz de marca altamente realista para interfaces de conversación más naturales utilizando la capacidad de voz neuronal personalizada. Basado en la tecnología neuronal de conversión de texto a voz y el modelo universal multilingüe de múltiples altavoces, la voz neuronal personalizada le permite crear voces sintéticas que son ricas en estilos de habla o idiomas cruzados adaptables con tan solo 30 minutos de audio. La voz realista y de sonido natural de la voz neuronal personalizada puede representar marcas y personas específicas y permitir a los usuarios interactuar con las aplicaciones de forma natural en un estilo conversacional. Echa un vistazo a este blog para guía paso a paso sobre cómo crear una voz neuronal personalizada.
Cumplimiento e IA responsable
Microsoft se compromete a invertir en el cumplimiento de los estándares regulatorios en todo el mundo para cumplir con los requisitos de cumplimiento de los fabricantes de automóviles. El servicio de voz, parte de Azure Cognitive Services, está certificado por SOC, FedRAMP, PCI DSS, HIPAA, HITECH e ISO. Respaldado por la infraestructura de Azure, el servicio de voz también ofrece seguridad, disponibilidad, cumplimiento y capacidad de administración de nivel empresarial.
Microsoft está comprometido con el desarrollo de la tecnología de inteligencia artificial de manera responsable. Utilizamos diferentes características técnicas y políticas para protegernos contra el uso indebido de la tecnología. Por ejemplo, estamos diseñando y lanzando Custom Neural Voice con la intención de proteger los derechos de las personas y la sociedad, fomentar la interacción transparente entre humanos y computadoras y contrarrestar la proliferación de deepfakes dañinos y contenido engañoso. Esto se alinea con Microsoft compromiso con la IA responsable. Ese compromiso incluye Notas de transparencia, que comunica el propósito, las capacidades y las limitaciones de un sistema de inteligencia artificial.
Aprende más
Azure Cognitive Services pone la IA a su alcance. Descubra cómo se acelera la innovación con una investigación innovadora en IA.