in

La carrera por salvar las lenguas indígenas mediante el reconocimiento automático de voz

La carrera por salvar las lenguas indígenas mediante el reconocimiento automático de voz

La carrera por salvar las lenguas indígenas mediante el reconocimiento automático de voz

Ilustración fotográfica del texto de Kwak’wala escrito por el instructor clínico de Northeastern Michael Running Wolf. Crédito: Alyssa Stone / Northeastern University

Michael Running Wolf todavía tiene esa vieja calculadora gráfica TI-89 que usaba en la escuela secundaria y que ayudó a impulsar su interés por la tecnología.

«En ese entonces, mis maestros vieron que estaba realmente interesado en él», dice Running Wolf, instructor clínico de ciencias de la computación en Northeastern University. «En realidad, un par de ellos me imprimieron cientos de páginas de instrucciones sobre cómo codificar» el dispositivo para que pudiera jugar.

Lo que Running Wolf, que creció en una remota aldea de Cheyenne en Birney, Montana, no se dio cuenta en ese momento, mientras estudiaba detenidamente la pila de copias impresas en casa a la luz de las lámparas de queroseno, era que en realidad estaba aprendiendo a programar por sí mismo.

«Pensé que estaba aprendiendo a poner juegos de computadora en mi calculadora», dice Running Wolf con una sonrisa.

Pero no había sido su primer encuentro con la tecnología. Running Wolf, que creció en las llanuras ventosas cerca de la reserva india del norte de Cheyenne, dice que aunque su familia, que es parte Cheyenne, parte Lakota, no tenía acceso diario a agua corriente o electricidad, a veces, cuando los vientos amainaban, el la energía parpadeaba y conectaba su consola Atari y jugaba con sus hermanas.

Estas primeras experiencias estimularían un interés de toda la vida en las computadoras, la inteligencia artificial y la ingeniería de software que Running Wolf ahora está aprovechando para ayudar a despertar las lenguas indígenas en peligro de extinción en América del Norte y del Sur, algunas de las cuales están tan críticamente en riesgo de extinción que sus recuentos de los hablantes nativos vivos se han reducido a un solo dígito.

El objetivo de Running Wolf es desarrollar métodos para documentar y mantener estos primeros idiomas a través del software de reconocimiento de voz automático, lo que ayuda a mantenerlos «vivos» y bien documentados. Sería un proceso, dice, que las comunidades tribales e indígenas podrían utilizar para complementar sus propios esfuerzos de recuperación de la lengua, que se han intensificado en los últimos años en medio de la crisis. amenazas que enfrentan los idiomas.

«El plan grandioso, el sueño lejano, es que podemos crear tecnología no solo para preservar, sino también para recuperar los idiomas», dice Running Wolf, quien enseña ciencias de la computación en el campus de Northeastern en Vancouver. «La preservación no es lo que queremos. Es como tomar algo, embalsamarlo y ponerlo en un museo. Los idiomas son seres vivos».

Lo mejor que se puede decir es que se han «ido a dormir», dice Running Wolf.

Y las amenazas a las lenguas indígenas son reales. De los aproximadamente 6.700 idiomas que se hablan en el mundo, alrededor del 40 por ciento están en peligro de atrofiarse y desaparecer para siempre, según Atlas de la UNESCO de las lenguas en peligro. La pérdida de estos idiomas también representa la pérdida de todo sistemas de conocimiento único en una cultura, y la capacidad de transmitir ese conocimiento a través de generaciones.

Si bien la situación parece grave, y lo es, en muchos casos, Running Wolf dice que casi todas las tribus nativas americanas están comprometidas con los esfuerzos de recuperación del idioma. En Nueva Inglaterra, una tribu notable que lo hace es la Tribu Mashpee Wampanoag, cuya lengua materna se enseña ahora en las escuelas públicas de Cape Cod, Massachusetts.

Pero el problema, dice, es que en el campo en constante evolución de la lingüística computacional, se ha dedicado poca investigación a las lenguas nativas americanas. Esto se debe en parte a la falta de datos lingüísticos, pero también a que muchos idiomas nativos son «polisintéticos», lo que significa que contienen palabras que comprenden muchos morfemas, que son las unidades más pequeñas de significado en el lenguaje, dice Running Wolf.

Los lenguajes polisintéticos a menudo tienen palabras muy largas, palabras que pueden significar una oración completa o denotar el significado de una oración.

Lo que complica aún más el esfuerzo es el hecho de que muchos idiomas nativos americanos no tienen una ortografía o un alfabeto, dice. En términos de qué idiomas necesitan para mantenerlos a flote, Running Wolf sostiene que las ortografías no son vitales. Muchas lenguas indígenas han sobrevivido gracias a una fuerte tradición oral en lugar de una sólida tradición escrita.

Pero para los académicos que buscan construir bases de datos y métodos de transcripción, como Running Wolf, los textos escritos son importantes para llenar los vacíos. Lo que impide que los investigadores construyan el reconocimiento automático de voz para las lenguas indígenas es precisamente la falta de datos de audio y textuales disponibles para ellos.

Utilizando cientos de horas de audio de varias tribus, Running Wolf ha logrado producir algunos resultados rudimentarios. Hasta ahora, el software de reconocimiento automático de voz que él y su equipo han desarrollado puede reconocer palabras simples y sencillas de algunas de las lenguas indígenas para las que tienen datos.

«En este momento, estamos creando un corpus de audio y textos para comenzar a mostrar resultados tempranos», dice Running Wolf.

Es importante destacar que, dice, «creo que tenemos un enfoque que es científicamente sólido».

Con el tiempo, Running Wolf dice que espera crear una forma para que las tribus proporcionen a sus jóvenes herramientas para aprender estos idiomas antiguos a través de la inmersión tecnológica, a través de cosas como la realidad aumentada o virtual, dice.

Algunas de estas tecnologías ya están siendo desarrolladas por Running Wolf y su equipo, integrado por un lingüista, un científico de datos, un ingeniero de aprendizaje automático y su esposa, quien solía ser gerente de programas, entre otros. Toda la investigación y el desarrollo en curso se están realizando en consulta con numerosas comunidades tribales, dice Running Wolf.

«Todo viene de la gente», dice. «Quieren trabajar con nosotros y estamos haciendo todo lo posible para respetar sus sistemas de conocimiento».


La extinción del lenguaje provoca la pérdida de conocimientos medicinales únicos


Proporcionado por Northeastern University


Citación: La carrera para salvar las lenguas indígenas utilizando el reconocimiento automático de voz (2021, 11 de octubre) recuperado el 22 de octubre de 2021 de https://techxplore.com/news/2021-10-indigenous-languages-automatic-speech-recognition.html

Este documento está sujeto a derechos de autor. Aparte de cualquier trato justo con fines de estudio o investigación privados, no se puede reproducir ninguna parte sin el permiso por escrito. El contenido se proporciona únicamente con fines informativos.



Fuente

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

GIPHY App Key not set. Please check settings

Fallout 76, F1 2021 y Dead By Daylight en los Días de Juego Gratis de Xbox One y Xbox Series X | S

Fallout 76, F1 2021 y Dead By Daylight en los Días de Juego Gratis de Xbox One y Xbox Series X | S

Dos hombres trabajan en una computadora portátil

Fortalecimiento de las defensas cibernéticas para organizaciones sin fines de lucro – Microsoft On the Issues