
Crédito: dominio público Unsplash/CC0
Desde el inicio de la pandemia Covid-19, los trabajadores han pasado innumerables horas en videoconferencias, ahora un accesorio de la vida de la oficina. A medida que más personas trabajan y viven de forma remota, las plataformas de videoconferencia como Zoom, MS equipos, FaceTime, Slack y Discord también son una gran parte de la socialización entre familiares y amigos.
Algunos intercambios son más agradables y fluyen mejor que otros, planteando preguntas sobre cómo se podría mejorar el medio de las reuniones en línea para aumentar la eficiencia y la satisfacción laboral.
Un equipo de científicos de la Universidad de Nueva York ha desarrollado un modelo de IA que puede identificar aspectos del comportamiento humano en videoconferencias, como la toma de turnos y las acciones faciales conversacionales, y predecir, en tiempo real, ya sea que las reuniones se consideren agradables y fluidas, cometidas y fluidas en lugar de asombrosas y marcadas por la toma de turnos más estrechas, basadas en estos comportamientos.
«Nuestro modelo de aprendizaje automático revela la intrincada dinámica de la interacción social de alto nivel mediante la decodificación de patrones sutiles dentro de las señales básicas de audio y video de las videoconferencias», dice Andrew Chang, miembro posdoctoral en el Departamento de Psicología de NYU y el autor principal del documento, que aparece en la publicación de la conferencia. Conferencia Internacional IEEE sobre acústica, habla y procesamiento de señales (ICASSP).
«Este avance representa un paso importante para mejorar dinámicamente las experiencias de videoconferencia al mostrar cómo evitar los descarrilamientos de conversación antes de que ocurran».
Para desarrollar este modelo de aprendizaje automático, los investigadores lo capacitaron en más de 100 horas de grabaciones de zoom, con el modelo tomando como voz de entrada, expresiones faciales y movimientos corporales para identificar momentos disruptivos cuando las conversaciones se volvieron poco fluidas o inseguras. Más específicamente, los científicos capacitaron al modelo para diferenciar entre momentos no fluidos que interrumpieron una reunión virtual y más intercambios fluidos.
En particular, el modelo calificó las conversaciones con brechas inusualmente largas en la toma de turnos como menos fluidas y agradables que aquellas en las que los participantes hablaron uno sobre el otro. Dicho de otra manera, se descubrió que los «silencios incómodos» son más perjudiciales que la dinámica caótica y entusiasta de un acalorado debate.
Para confirmar la precisión de las evaluaciones del modelo, un equipo independiente de más de 300 jueces humanos vio muestras de las mismas imágenes de videoconferencia, calificando la fluidez de las conversaciones y cuánto pensaban que los participantes de la reunión disfrutaron de los intercambios. En general, los evaluadores humanos coincidieron estrechamente con las evaluaciones del modelo de aprendizaje automático.
«La videoconferencia ahora es una característica destacada en nuestras vidas, por lo que comprender y abordar sus momentos negativos es vital no solo para fomentar una mejor comunicación interpersonal y conexión, sino también para mejorar la eficiencia de las reuniones y la satisfacción laboral de los empleados», dice Dustin Freeman, un académico visitante en el departamento de psicología de NYU y el autor senior del documento.
«Al predecir los momentos de desglose conversacional, este trabajo puede allanar el camino para que los sistemas de videoconferencia mitigen estas averías y suavizan el flujo de conversaciones mediante la manipulación implícita de retrasos de señal para acomodar o proporcionar señales explícitamente a los usuarios, con las que actualmente estamos experimentando».
Más información:
A. Chang, et al. El aprendizaje automático multimodal puede predecir la fluidez y el disfrute de la videoconferencia, Conferencia internacional IEEE sobre acústica, procesamiento de habla y señales (ICASSP), Doi: 10.1109/icasp49660.2025.10889480
Citación: ¿Puede AI decirnos si esas llamadas de zoom fluyen sin problemas? Un nuevo estudio dice que sí (2025, 10 de marzo) recuperado el 10 de marzo de 2025 de https://techxplore.com/news/2025-03-ai-smoothly.html
Este documento está sujeto a derechos de autor. Además de cualquier trato justo con el propósito de estudio o investigación privada, no se puede reproducir ninguna parte sin el permiso por escrito. El contenido se proporciona solo para fines de información.
GIPHY App Key not set. Please check settings