L’intelligenza artificiale parla quasi esclusivamente in inglese: grave danger

30 Settembre 2021
872 Visualizzazioni

L’intelligenza artificiale è in grado di capire il linguaggio degli esseri umani? Dipende da quale lingua parlano.

Facciamo riferimento al Natural Language Processing (NLP), una tecnologia particolarmente efficiente quando si tratta di lingua inglese, ma decisamente basica se si fa riferimento agli altri 200 (più o meno) idiomi parlati sul globo terrestre.

Il divario NLP

Per capire meglio come funziona questo Natural Language Processing, ci rifacciamo alla definizione standard: si tratta di un’area dell’intelligenza artificiale che comprende, analizza e dà un senso alle lingue umane. Il NLP riguarda i sistemi che riescono a comprendere il linguaggio e svolgere compiti di traduzione, controllo e classificazione grammaticale.

Questo procedimento è cruciale nello sviluppo e mantenimento degli strumenti alimentati dalle AI. Basti pensare a quanto può essere fondamentale per una redazione giornalistica o un laboratorio di ricerca internazionale.

Tuttavia, la tecnologia NLP non è ancora uniforme. Neanche un po’. Questo perché la maggioranza dei progressi tecnologici costruiti insieme ai sistemi NLP sono stati fatti in inglese.

Le motivazioni della disparità fra l’inglese e le altre lingue nel NLP

Lo svantaggio più evidente per i sistemi di Natural Language Processing è la mancanza di dati. Nel campo NLP le lingue vengono distinte in alta risorsa e bassa risorsa: le lingue ad alta risorsa sono quelle per le quali è immediatamente disponibile una gran quantità di dati tipo le librerie software.

Invece per le lingue a bassa risorsa sono oggi disponibili solo un’infinitesimale quantità di dati, tanto che molte agenzie di stampa sono spesso costrette a trovare, raccogliere e tradurre i dati in maniera autonoma. Ovviamente, la lingua di gran lunga più ricca di risorse, è l’inglese.

Questo non è tutto: anche quando le librerie software risultano disponibili, questo non basta a dare una garanzia di successo. Idiomi come lo spagnolo, per esempio, richiedono un processo molto più lungo perché i modelli non sono affatto addestrati come quelli in inglese e i software non sono in grado di riconoscere la grammatica, la dizione e la pronuncia di molte lingue neo latine.

NLP e la mancanza di tempo: prova ad errore

Insieme ai dati, un’altra risorsa che ancora scarseggia è il tempo. L’implementazione delle tecnologie NLP negli istituti non inglesi non riesce a tenere il ritmo serrato del ciclo di notizie.

Per ovviare al problema, molte realtà che utilizzano le AI per progetti di lunga durata decidono di non avvalersi delle informazioni date dalle breaking news, e quindi non sono tenute a rispettare scadenze rigide e deadline giornaliere.

La prova ad errore è insita nel ragionamento che molte redazioni sono costrette a seguire: abbiamo bisogno di tempo per sperimentare, testate e produrre questi strumenti. Abbiamo bisogno di avere l’opportunità di fallire, è solo così che impariamo.

Come si superano i limiti imposti dalla mancanza di dati e di tempo?

Con tenacia e pazienza. Il suggerimento degli esperti di Artificial Intelligence suggerisce di osservare le soluzioni esistenti e solo successivamente di duplicare il lavoro fatto in inglese.

Insomma, la soluzione per il momento sembra essere quella dell’applicazione del NLP alla lingua desiderata: valutare la qualità del modello anglosassone (solitamente altissima) e poi addestrarlo alle lingue che hanno una matrice opposta o un alfabeto completamente diverso.

Quando la messa a punto dall’inglese a un’altra lingua risulta ottimale, si aprono diverse opportunità di applicare il format standard a più soluzioni, e perfino di esplorare soluzioni multilingue.

Il segreto del successo: NLP fra supervisione e aspettative realistiche

Tutte le lingue presentano sfide diverse e risultati diversi, a seconda della disponibilità di risorse di dati e della presenza di alcuni aspetti culturali come atteggiamenti e tradizioni che, inevitabilmente, definiscono il nostro modo di comunicare.

Proprio perché l’intelligenza artificiale è anche e soprattutto una questione culturale, non esiste un approccio unico. Nessuna formula magica correrà incontro al progresso.

E infatti, la supervisione umana è di primaria importanza a fronte delle aspettative realistiche che si rivelano fondamentali nei progetti di lunga durata. L’implementazione delle AI nelle lingue a bassa risorsa, è un prospetto di lunghissima durata.

In conclusione

Le esperienze e gli esperimenti nelle redazioni e nei laboratori di ricerca che collaborano attivamente con le intelligenze artificiali e con i sistemi di NLP in lingue diverse da quella inglese mostrano tutta una serie di ostacoli che ad oggi sembrano insuperabili.

Però queste stesse barriere indicano la necessità di ottenere una collaborazione ancora maggiore fra umani e sistemi operativi avanguardistici. Riusciremo a far capire ai nostri amici robot che we don’t spik inglish so uell?

Leggi anche: