in

Amazon Chime SDK Call Analytics: análisis de tono de voz en tiempo real y búsqueda de oradores | Servicios web de Amazon

Amazon Chime SDK Call Analytics: análisis de tono de voz en tiempo real y búsqueda de oradores | Servicios web de Amazon

Hoy, me complace anunciar la disponibilidad de análisis de llamadas de Amazon Chime SDK, un nuevo conjunto de capacidades que ayuda a que sea más fácil y rentable grabar y generar información sobre llamadas de audio en tiempo real: transcripción, análisis de tonos de voz y búsqueda de oradores. . También hemos mejorado la sección SDK de Amazon Chime de la Consola de administración de AWS para permitirle integrar servicios basados ​​en aprendizaje automático (ML), como estas nuevas capacidades de análisis de llamadas o Amazon Transcribe en sus aplicaciones de audio en solo unos pocos pasos.

Análisis de voz: análisis de tono de voz y búsqueda de oradores
El análisis de voz ofrece información en tiempo real sobre las conversaciones de audio. Ayuda a detectar y clasificar a los participantes que expresan un tono positivo, neutral o negativo. Por lo general, las empresas que trabajan en industrias reguladas tienen la obligación de registrar o desean analizar las conversaciones entre los empleados y sus socios comerciales, clientes o proveedores.

Análisis de tono de voz utiliza ML para extraer sentimientos de una señal de voz en función de un análisis conjunto de información léxica y lingüística, así como información acústica y tonal. El análisis de tonos de voz para llamadas en vivo se entrega en el lago de datos de su elección, además de lo cual puede crear sus propios paneles para visualizar los datos.

Tomemos un ejemplo de la industria financiera. A veces se requiere que los supervisores de la sala de negociación registren todas las conversaciones de negociación que ocurren en el piso. El análisis del tono de voz les ayuda a cumplir con los requisitos reglamentarios. También pueden brindar estos conocimientos a los comerciantes para ayudarlos a mejorar su productividad. Pero las finanzas no son la única industria que necesita grabar y analizar llamadas. Hemos recibido solicitudes similares de clientes en las industrias de subcontratación de procesos comerciales (BPO), sector público, atención médica, telecomunicaciones y seguros.

Junto con el análisis de tono de voz, sus aplicaciones ahora pueden beneficiarse de búsqueda de altavoces para ayudar a unir a los oradores con una base de datos existente. Solo requiere una pequeña muestra para reconocer a un hablante en función de su voz almacenada en una base de datos de voces conocidas. La búsqueda de oradores ayuda a sus aplicaciones a agilizar la búsqueda de llamadas y enriquecer los registros y transcripciones de llamadas con atribución de identidad. La búsqueda de oradores ofrece un identificador interno único sugerido para el orador y una puntuación de confianza. La decisión de emparejar al orador actual con un orador conocido de su organización depende de su solicitud. Algunos de nuestros clientes planean usar la búsqueda de oradores para etiquetar a los oradores en tiempo real en la comunicación que se está produciendo. torretas comercialesque son dispositivos compartidos.

Integración con AI Services en la consola de administración de AWS
Queremos que sea más fácil para los desarrolladores agregar estas capacidades a las aplicaciones de telefonía existentes sin necesidad de experiencia en telefonía, infraestructura en la nube o IA.

Es por eso que agregamos una configuración gráfica más fácil de usar en la sección SDK de Amazon Chime de la consola. En la consola, puede elegir el servicio de IA de AWS que desea utilizar para analizar datos de audio en tiempo real: análisis de voz, Amazon Transcribe o Amazon Transcribe Call Analytics. Ya sea que elija usar análisis de voz o Amazon Transcribe para generar información, no tiene que escribir ningún código de integración. Gestionamos las integraciones con los servicios de IA de AWS y sus aplicaciones de voz o telefonía. La consola lo ayuda a definir dónde desea enviar los datos analíticos: un flujo de Amazon Kinesis o un depósito de Amazon Simple Storage Service (Amazon S3). El análisis de voz puede enviar notificaciones en tiempo real a una función implementada en AWS Lambda, una cola de SQS o un tema de Amazon Simple Notification Service (Amazon SNS).

Para visualizar información, el análisis de llamadas también ofrece análisis a un lago de datos de su elección. A continuación, puede utilizar Amazon QuickSight o Tableau para crear tableros y obtener información de medios en tiempo real. Estos tableros se pueden incrustar en aplicaciones, wikis y portales. Por supuesto, no te dejamos solo con tus datos. Puede descargar paneles prediseñados como plantillas de AWS CloudFormation para implementarlos en su propia cuenta de AWS. El enlace para descargar estas plantillas está disponible en la consola.

Finalmente, el análisis de llamadas puede generar alertas en tiempo real mediante la publicación de eventos en Amazon EventBridge. Puede enrutar estos eventos a cualquier destino de su elección, en su cuenta de AWS o en aplicaciones de terceros compatibles.

Al utilizar el análisis de llamadas, puede reducir el tiempo inicial del proyecto para generar información de audio en tiempo real de meses a días.

Cómo funciona
Me gustaría mostrarte cómo funciona.

En la sección SDK de Amazon Chime de la consola, abro Configuración bajo Análisis de llamadas en el menú del lado izquierdo. Luego, selecciono Crear configuración.

Amazon Chime SDK - Crear configuración

Le doy un nombre a mi configuración. Opcionalmente, también puedo asociar etiquetas.

SDK de Amazon Chime: primer paso de configuración

Bajo Configurar el servicio de análisis, Puedo elegir entre los servicios de análisis de voz de Amazon Chime SDK o Amazon Transcribe para analizar las llamadas. Para esta demostración, selecciono análisis de voz.

SDK de Amazon Chime: segundo paso de configuración

Configuro donde enviar el análisis. Los resultados del análisis de voz siempre se envían a Kinesis. Especifico un flujo de datos de Kinesis que creé anteriormente. Cuando quiero usar una herramienta de inteligencia comercial como Quicksight para crear un tablero con resultados de análisis, también especifico un depósito S3 para recibir el análisis.

La consola también me brinda el enlace a las plantillas de CloudFormation que puedo usar para crear los paneles de análisis de voz.

Finalmente, elijo una función de Lambda, una cola de SQS o un tema de SNS que recibirá notificaciones de eventos, como cuando los análisis estén disponibles, se produzca una nueva inscripción de voz o el resultado de una verificación de voz. En el último caso, la carga útil tiene el siguiente aspecto:

{
    ...common to all events...
    "detail-type": "SpeakerSearchStatus",
    "detail": {
        "taskId": "uuid",
        "detailStatus": "IdentificationSuccessful",
        "speakerSearchDetails" : {
            "results": [
                {
                    "voiceProfileId": "guid",
                    "confidenceScore": "0.94",
                },
                {
                    "voiceProfileId": "guid",
                    "confidenceScore": "0.92",
                },
                {
                    "voiceProfileId": "guid",
                    "confidenceScore": "0.91",
                },
                ... (up to 10)
            ]
        },
        "isCaller": false,
        "voiceConnectorId": "guid",
        "transactionId": "guid"

        ...details from Voice connector
    }
}

Para esta demostración, elijo una cola SQS existente.

Amazon Chime SDK - Tercer paso de configuración

Bajo reconocimiento de consentimiento, Selecciono todas las casillas y selecciono Próximo.

SDK de Amazon Chime: consentimiento del segundo paso de configuración

El siguiente paso solo está disponible cuando no especifiqué ningún servicio de análisis en el paso anterior. Nos permite configurar las grabaciones de voz. Las grabaciones están disponibles cuando no se selecciona ningún análisis.

Bajo Configurar permisos de acceso, Elijo un rol de AWS Identity and Access Management (IAM) creado anteriormente que permite que el SDK de Amazon Chime acceda a los otros servicios de AWS que configuré: el flujo de datos de Kinesis, el depósito de S3 y la función de Lambda, la cola de SQS o el tema de SNS. La consola puede crear un rol de IAM para mí si aún no tengo uno.

SDK de Amazon Chime - Configuración en cuatro pasos

El siguiente paso está disponible si seleccioné el servicio Amazon Transcribe en Configurar el servicio de análisis. Me permite configurar alertas en tiempo real a través de EventBridge. Puedo configurar reglas para enviar mensajes basados ​​en coincidencia de palabras clave, sentimiento detectado o detección de problemas.

El paso final es Revisar y Crear mi configuración. Reviso los detalles de configuración y luego, selecciono Crear configuración.

Finalmente, vinculo esta configuración a un conector de voz bajo el Conector de voz sección, en la Transmisión pestaña.

¡Eso es todo! Como mencioné anteriormente, no se requiere conexión entre los servicios de AWS o el conocimiento de IA.

Después de que los datos lleguen a Kinesis o a su depósito S3, puede señalar su solución de informes comerciales preferida. Cuando utiliza la plantilla QuickSight que proporcionamos, puede comenzar en minutos con una descripción general de alto nivel y una vista detallada, como se muestra en la siguiente captura de pantalla.

Análisis de llamadas del SDK de Chime: panel general

Chime SDK Call Analytics: análisis profundo del tablero

El panel detallado le brinda representaciones gráficas sobre la distribución de los sentimientos y emociones de los agentes y clientes. También obtiene un análisis detallado y una transcripción de la conversación.

Precios y disponibilidad
La adopción de estas capacidades en sus aplicaciones de audio no requiere una inversión inicial en infraestructura; se le cobrará en función de su uso. El precio es por minuto de datos de audio analizados. Visite los precios del SDK de Amazon Chime para obtener más detalles.

El análisis de llamadas está disponible en las siguientes regiones de AWS: EE. UU. Este (Ohio, N. Virginia), Asia Pacífico (Singapur) y Europa (Fráncfort).

En esta publicación, analicé el análisis de llamadas del SDK de Amazon Chime, un nuevo conjunto de capacidades que hace que sea más fácil y rentable grabar y generar información sobre llamadas de audio en tiempo real. Con su enfoque en la facilidad de uso, estas nuevas capacidades se adaptan particularmente bien a los clientes con un conocimiento mínimo de infraestructura en la nube, telefonía y ML.

¡Comienza hoy y configura tu primer tablero!

–seb



Fuente

Written by TecTop

Los ejecutivos más grandes de Apple han visto su próxima gran cosa, pero no son creyentes

Los ejecutivos más grandes de Apple han visto su próxima gran cosa, pero no son creyentes

Revisión de Terra Nil 2

Terra Nil — De vuelta a la pila