Questa nuova tecnologia di riconoscimento vocale utilizza minuscoli sensori facciali per trascrivere le parole pronunciate

I ricercatori in Corea del Sud hanno progettato un nuovo sistema di riconoscimento vocale silenzioso in grado di riconoscere accuratamente le parole tracciando i movimenti facciali.

La tecnologia mira ad aiutare le persone sorde, che non possono sempre comunicare con gli altri usando il linguaggio dei segni. Ma potrebbe anche essere utile ai militari o alla polizia, quando la comunicazione radio è complicata a causa del rumore circostante.

L’interfaccia vocale silenziosa si basa su sensori di deformazione per rilevare l’espansione e la contrazione della pelle mentre una persona pronuncia le parole. Utilizzando un algoritmo di deep learning, la nuova tecnologia può tracciare e convertire questi movimenti facciali in parole.

“Il sensore di deformazione applicato al viso si allunga e si restringe in base all’elasticità della pelle quando una persona parla. E le proprietà elettriche dei sensori di deformazione cambiano di conseguenza”, ha detto a Euronews Next Taemin Kim, della Yonsei University School of Electrical and Electronic Engineering.

I sensori ultrasottili sono resistenti al sudore e al sebo e il sistema ha riconosciuto un set di 100 parole con una precisione di quasi l’88%: una prestazione elevata senza precedenti, secondo i risultati del team, pubblicati su Comunicazioni sulla natura.

Come i pixel in un’immagine

I sensori di riconoscimento vocale silenziosi non sono nuovi, ma il team afferma che quelli che hanno progettato sono centinaia di volte più piccoli di quelli esistenti – con uno spessore inferiore a 8 µm – offrendo al loro sistema un’elevata scalabilità.

In altre parole, dovrebbero semplicemente aggiungerne altri, come i pixel in un’immagine, per tracciare meglio i movimenti del viso e riconoscere più parole.

“Per classificare e riconoscere più parole, è necessaria una maggiore risoluzione delle informazioni. Ed è per questo che i ricercatori oggi stanno cercando di sviluppare un sistema vocale silenzioso ad alta risoluzione che combini il nostro sensore di deformazione indossabile con un circuito altamente integrato che viene normalmente utilizzato in display o produzione di semiconduttori”, ha affermato Kim.

“Se riusciamo ad aumentare la quantità di informazioni, e quindi il sistema può riconoscere più parole e frasi, ci aspettiamo che un giorno le persone con disturbi del linguaggio possano avere conversazioni nella loro vita quotidiana”.

Aiutare le persone sorde a comunicare

L’Organizzazione Mondiale della Sanità stima che oltre il 5% della popolazione mondiale – circa 430 milioni di persone – abbia una perdita dell’udito “disabilitante”.

Questo in genere li lascia fare affidamento su apparecchi acustici, linguaggio dei segni o altre terapie riabilitative per comunicare.

Gli scienziati hanno lavorato su tecnologie di riconoscimento vocale silenzioso per consentire la comunicazione non acustica.

Tuttavia, è stato difficile sviluppare uno strumento che potesse essere utilizzato sull’area limitata di un volto umano in un ambiente dinamico.

Un altro metodo è la tecnologia di riconoscimento della vista che utilizza una fotocamera per registrare i movimenti del viso ad alta risoluzione, ma non è un’opzione pratica nelle impostazioni quotidiane.

Per ulteriori informazioni su questa storia, guarda il video nel lettore multimediale sopra.

Image:Getty Images