
La tecnología da voz a quienes no pueden hablar
Por: Bernardino Antelo Esper
Publicado el: 10/01/2020 a las 12:32:00 pm
La voz es una parte importante de nosotros, pues por ella no solo se transmiten rasgos como la edad, la personalidad o el estilo de vida sino también nuestra forma de pensar y comunicarnos. Sin embargo, muchas personas sufren algún trastorno del lenguaje que les impide comunicarse. Hoy la tecnología les da voz solo con que estas personas imaginen lo que quieren decir. Xataka nos trae la nota completa.
Utilizando modelos
computacionales conocidos como redes neuronales, un grupo de investigadores ha reconstruido
palabras y oraciones que, en algunos casos, eran inteligibles para los oyentes
humanos y que intentaban ser verbalizadas por diversos pacientes.
El desarrollo de esta técnica
permite "escuchar" a las personas que no puede hablar debido a alguna
enfermedad simplemente descifrando los datos que registraban en el cerebro de
los pacientes. Es decir, bastaba con que la persona imaginara lo que
quería decir.
Futuras prótesis de voz
Las personas que han perdido la
capacidad de hablar después de un derrame cerebral o una enfermedad pueden usar
sus ojos o hacer otros pequeños movimientos para controlar un cursor o
seleccionar letras en pantalla, tal y como hacía Stephen Hawking. Pero si
una interfaz cerebro-computadora pudiera recrear el discurso directamente,
podrían recuperar mucho más que el habla: también el control sobre el tono y la
inflexión de lo que quieren decir, por ejemplo, o la capacidad llevar a cabo
una conversación más fluida.
Este pequeño milagro ha sido
realizado gracias a los datos con los que se han entrenado las redes neuronales
artificiales que procesan patrones complejos del cerebro. Para el estudio, se
basaron en los datos de cinco personas con epilepsia.
La red analizó grabaciones de la
corteza auditiva (que está activa tanto durante el habla como la audición) a
medida que esos pacientes escuchaban grabaciones de historias y personas que
nombraban dígitos de cero a nueve. Luego, un ordenador reconstruyó los números
hablados solo a partir de datos neuronales; cuando el ordenador
"pronunció" los números, un grupo de oyentes los identificó con
un 75% de precisión.
Las señales cerebrales cuando una
persona "habla" o "escucha" en silencio su voz en su cabeza
no son idénticas a las señales del habla o del oído. Sin un sonido externo que
coincida con la actividad cerebral, puede ser difícil para un ordenador incluso
determinar dónde comienza y termina el habla interna.
Sin embargo, se están dando
pasos impresionantes en este sentido, para quizá algún día crear una prótesis
de voz artificial. Otro ejemplo en este sentido es el protagonizado por el
neurocirujano Edward Chang y su equipo en la Universidad de California, San
Francisco, que reconstruyeron oraciones enteras a partir de la actividad
cerebral capturada del habla y las áreas motoras mientras tres pacientes con
epilepsia leían en voz alta. En una prueba online, 166 personas escucharon una
de las oraciones y tuvieron que seleccionarla entre 10 opciones escritas.
Algunas oraciones se identificaron correctamente más del 80% del tiempo.
Otro gran salto en la calidad de
estas técnicas pasaría, quizás, por proporcionar retroalimentación al
usuario de la interfaz cerebro-computadora: si el usuario puede escuchar la
interpretación del habla del ordenador en tiempo real, podría ajustar sus
pensamientos para obtener el resultado que desea.
Anteriormente este tipo de
estudios se centraban en tratar de comprender los movimientos musculares que
acaban produciendo las palabras, sin embargo, esta producción de lenguaje
natural involucra más de cien músculos y además un movimiento no siempre
resulta en un sonido. Para Chethan Pandarinath y Yahia Ali,
expertos en ingeniería biomédica en la Universidad de Emory, "el enfoque
de estos autores resulta en una menor distorsión acústica que los anteriores
sistemas de descodificación".
Poco a poco, pues, estudios más
audaces nos están encaminando hacia la posibilidad de que las personas que
tienen dificultades para hablar puedan hacerlo con una fluidez mayor, quizá
en un futuro próximo indistinguible del habla normal.