Se Alexa non parla il dialetto: IA e diversità linguistica, le sfide aperte
Nel grande dibattito sull’intelligenza artificiale - fra analisi sulle trasformazioni che introdurrà nelle nostre vite quotidiane e legittimi interrogativi sulle implicazioni etiche - c’è un tema che forse è rimasto un po’ fuori dai radar. In che modo l’IA - e la diffusione crescente di dispositivi basati su tecnologie di questo tipo - impatta e impatterà sulla diversità linguistica? Lo scorso ottobre, in occasione dell’evento VinKiamo Südtirol che ha coinvolto nel campus di Bressanone le scuole secondarie nell’ambito del progetto AlpiLinK - Lingue Alpine in Contatto, abbiamo fatto un piccolo esperimento: assieme agli studenti e studentesse abbiamo testato alcuni assistenti vocali e applicazioni basati sulla generative IA.
Ecco che interrogando uno dei più diffusi assistenti in ladino gardenese, abbiamo ricevuto una risposta, senza rapporto con la domanda, in albanese. Ma anche con gli altri dispositivi non è andata molto meglio, le risposte sono state parziali. Le applicazioni basate sull’IA non sono allenate a riconoscere varietà linguistiche minoritarie oppure dialetti perché le basi di dati, orali o scritte, a cui possono accedere, non sono sufficienti.
Meta - il colosso del big tech che controlla fra l’altro Facebook, Instagram, e WhatsApp - sta sviluppando un sistema di traduzione per le lingue non scritte che rappresentano una quota ancora significativa delle lingue del mondo: i primi test sono stati sviluppati con l’Hokkien, lingua parlata a Taiwan da milioni di persone. Diverso il caso delle varietà linguistiche minoritarie, in cui le banche dati - orali e scritte - disponibili con cui allenare gli algoritmi basati sull’IA, che richiedono grandi quantità di dati, sono ancora limitate. Con il progetto AlpiLinK stiamo costruendo il più grande database italiano dedicato alle varietà linguistiche minoritarie (alpilink.it) implementato in modalità crowdsourcing e aperto alla partecipazione di tutti i cittadini, ma in ogni caso la strada da percorrere appare ancora molto lunga e riesce difficile immaginare di poter arrivare a raccogliere un corpus così ampio da soddisfare questa esigenza.
Un tema che apre nuovi interrogativi per il momento senza risposta: se l’IA è destinata a diventare sempre più pervasiva, come fare in modo che questa diffusione non comprometta la diversità linguistica? Gli assistenti vocali sono dispositivi spesso impiegati all’interno delle mura domestiche, ambito privilegiato per quanto riguarda l’uso del dialetto: per interrogare questi strumenti, è invece necessario “cambiare” il proprio linguaggio.
Non solo: ci sono varietà linguistiche, pensiamo ad esempio ai dialetti tirolesi nel nostro territorio, il cui uso non è limitato ai contesti informali, ma è esteso anche a molti ambiti formali, per esempio alle riunioni di lavoro. Anche in questo caso si pone una questione di accessibilità alle tecnologie. Il fatto che non sia possibile utilizzare i sempre più avanzati tool IA che registrano i meeting per restituire poi un report dettagliato rappresenta senz’altro un limite, e rischia di “imporre” un cambiamento nella scelta dell’uso della lingua.
Progetti come AlpiLinK possono rappresentare un primo passo verso l’integrazione delle lingue minoritarie nelle nuove tecnologie.
Foto: Lazar Gugleta su Unsplash
Autori: Birgit Alber, docente di Linguistica Tedesca (Facoltà di Scienze della Formazione), Joachim Kokkelmans, ricercatore Linguistica Tedesca (Facoltà di Scienze della Formazione).
L’intervento dei due accademici si inserisce nell’ambito del progetto AlpiLinK che vede in rete cinque atenei - Università di Verona, Libera Università di Bolzano, Università di Trento, Università di Torino, Università della Valle d’Aosta - per la realizzazione del più grande database digitale dedicato ai dialetti e alle lingue minoritarie del Nord Italia. Tutte le persone che parlano un dialetto o una lingua minoritaria possono partecipare al progetto attraverso il sito alpilink.it compilando in pochi minuti l’audio-sondaggio dedicato. Un modello di ricerca partecipativo, che punta sul coinvolgimento “dal basso” e che sta raccogliendo un notevole interesse.