L'A.I. Aiutaci a risolvere il mistero delle lingue perdute?

Francesco Riccardo Iacomino/Getty Images

Ci sono molte cose che distinguono gli esseri umani dalle altre specie, ma una delle più importanti è il linguaggio. La capacità di mettere insieme vari elementi in combinazioni essenzialmente infinite è una caratteristica che “è stata spesso considerata in passato caratteristica fondamentale che definisce gli esseri umani moderni, la fonte della creatività umana, dell’arricchimento culturale e della complessa struttura sociale”, come una volta il linguista Noam Chomsky disse.

Contenuti

  • Resuscitare i morti (lingue)
  • Il futuro

Ma per quanto il linguaggio sia stato importante nell’evoluzione degli esseri umani, c’è ancora molto che non sappiamo su come si è evoluto. Mentre le lingue morte come il latino hanno una ricchezza di testimonianze scritte e discendenti attraverso i quali possiamo comprenderle meglio, alcune lingue sono perse nella storia.

Video consigliati

I ricercatori sono riusciti a ricostruire alcune lingue perdute, ma il processo di decifrazione può essere lungo. Ad esempio, l’antica scrittura lineare B è stata “risolta” oltre mezzo secolo dopo la sua scoperta, e alcuni di coloro che ci hanno lavorato non sono vissuti abbastanza per vedere il lavoro completato. Una scrittura più antica chiamata Lineare A, il sistema di scrittura della civiltà minoica, rimane indecifrata.

Imparentato

  • Premi Tech For Change CES 2023 di Digital Trends
  • La formula divertente: perché l'umorismo generato dalle macchine è il Santo Graal dell'A.I.
  • Leggi la "scrittura sintetica" stranamente bella di un A.I. che pensa che sia Dio

I linguisti moderni hanno però uno strumento potente a loro disposizione: l’intelligenza artificiale. Addestrando l'A.I. per individuare i modelli nelle lingue indecifrate, i ricercatori possono ricostruirli, svelando i segreti del mondo antico. Un recente e innovativo approccio neurale da parte dei ricercatori del Massachusetts Institute of Technology (MIT). ha già mostrato successo nel decifrare la lineare B e potrebbe un giorno portare alla risoluzione di altri problemi perduti le lingue.

Resuscitare i morti (lingue)

Proprio come scuoiare un gatto, esiste più di un modo per decodificare una lingua perduta. In alcuni casi, la lingua non ha testimonianze scritte, quindi i linguisti cercano di ricostruirla tracciando l'evoluzione dei suoni attraverso i suoi discendenti. È il caso del protoindoeuropeo, ipotetico antenato di numerose lingue dell'Europa e dell'Asia.

In altri casi, gli archeologi portano alla luce documenti scritti, come nel caso della lineare B. Dopo che gli archeologi scoprirono delle tavolette sull'isola di Creta, i ricercatori passarono decenni a scervellarsi sugli scritti, arrivando infine a decifrarli. Sfortunatamente, questo non è attualmente possibile con la lineare A, poiché i ricercatori non hanno abbastanza materiale da studiare. Ma potrebbe non essere necessario.

Ma l’inglese e il francese sono lingue vive con secoli di sovrapposizione culturale. Decifrare una lingua perduta è molto più complicato.

Un progetto dei ricercatori del MIT illustra le difficoltà di decifrazione, nonché le potenzialità dell'A.I. per rivoluzionare il campo. I ricercatori hanno sviluppato un approccio neurale per decifrare le lingue perdute “informato da modelli di cambiamento linguistico documentati nella linguistica storica”. Come dettagliato in un documento del 2019, mentre il precedente A.I. poiché le lingue per decifrare dovevano essere adattate a una lingua specifica, questa no.

"Se guardi qualsiasi traduttore o prodotto di traduzione disponibile in commercio", afferma Jiaming Luo, il responsabile autore dell'articolo, "tutte queste tecnologie hanno accesso a un gran numero di ciò che chiamiamo parallelo dati. Puoi pensarli come Rosetta Stones, ma in una quantità molto grande.

Un corpus parallelo è una raccolta di testi in due lingue diverse. Immagina, ad esempio, una serie di frasi sia in inglese che in francese. Anche se non conosci il francese, confrontando i due insiemi e osservando gli schemi, puoi mappare le parole di una lingua sulle parole equivalenti dell’altra.

“Se addestri un essere umano a fare questo, se vedi più di 40 milioni di frasi parallele”, spiega Luo, “sono fiducioso che sarai in grado di trovare una traduzione”.

Ma l’inglese e il francese sono lingue vive con secoli di sovrapposizione culturale. Decifrare una lingua perduta è molto più complicato.

“Non possiamo permetterci il lusso dei dati paralleli”, spiega Luo. “Quindi dobbiamo fare affidamento su alcune conoscenze linguistiche specifiche su come si evolve la lingua, su come le parole si evolvono nei loro discendenti”.

Decifrazione neurale/MIT

Per creare un modello che potesse essere utilizzato indipendentemente dalle lingue coinvolte, il team ha stabilito dei vincoli basati sulle tendenze che possono essere osservate attraverso l'evoluzione delle lingue.

"Dobbiamo fare affidamento su due livelli di comprensione della linguistica", afferma Luo. “Uno è a livello del personaggio, che è tutto ciò che sappiamo: quando le parole si evolvono, di solito si evolvono da sinistra a destra. Puoi pensare a questa evoluzione come una sorta di corda. Quindi forse una stringa in latino è ABCDE e molto probabilmente la avresti cambiata in ABD o ABC, preservando comunque l'ordine originale in un certo senso. Questo è ciò che chiamiamo monotono”.

A livello del vocabolario (le parole che compongono una lingua), il team ha utilizzato una tecnica chiamata “mappatura uno a uno”.

"Ciò significa che se estrai l'intero vocabolario del latino e estrai l'intero vocabolario dell'italiano, vedrai una sorta di corrispondenza uno a uno", offre Luo come esempio. “La parola latina per ‘cane’ probabilmente si evolverà nella parola italiana per ‘cane’ e la parola latina per ‘gatto’ probabilmente si evolverà nella parola italiana per ‘gatto’”.

Per testare il modello, il team ha utilizzato alcuni set di dati. Hanno tradotto l'antica lingua ugaritica in ebraico, la lineare B in greco e, per confermare l'efficacia del modello, eseguito il rilevamento di parole affini (parole con ascendenza comune) nelle lingue romanze spagnolo, italiano e Portoghese.

È stato il primo tentativo noto di decifrare automaticamente la lineare B e il modello ha tradotto con successo il 67,3% degli affini. Il sistema è stato inoltre migliorato rispetto ai modelli precedenti per la traduzione dell'ugaritico. Dato che le lingue provengono da famiglie diverse, ciò dimostra che il modello è flessibile, oltre che più accurato rispetto ai sistemi precedenti.

Il futuro

La lineare A rimane uno dei grandi misteri del linguaggio, e rompere quell’antica noce sarebbe un’impresa impresa straordinaria per A.I. Per ora, dice Luo, una cosa del genere è del tutto teorica, per una coppia motivi.

Innanzitutto, la Lineare A offre una quantità di dati inferiore rispetto anche alla Lineare B. C’è anche la questione di capire che tipo di scrittura sia la Lineare A.

"Direi che la sfida unica per la lineare A è che ci sono molti caratteri o simboli pittorici o logografici", afferma Luo. "E di solito quando hai molti di questi simboli, sarà molto più difficile."

Immagini del marchio X/Getty Images

Ad esempio, Luo confronta inglese e cinese.

“L’inglese ha 26 lettere se non si contano le maiuscole, e il russo ne ha 33. Questi sono chiamati sistemi alfabetici. Quindi devi solo immaginare una mappa per questi 26 o 30 personaggi", dice.

“Ma per i cinesi bisogna avere a che fare con migliaia di loro”, continua. “Penso che una stima del numero minimo di caratteri da padroneggiare solo per leggere un giornale sarebbe di circa 3.000 o 5.000. La lineare A non è cinese, ma a causa dei suoi simboli pittorici o logografici e cose del genere, è decisamente più difficile della lineare B."

Sebbene la Lineare A sia ancora indecifrata, il successo del nuovo approccio di decifrazione neurale del MIT è in decifrare automaticamente la lineare B, andando oltre la necessità di un corpus parallelo, è promettente cartello.

Raccomandazioni degli editori

  • L’intelligenza artificiale ha trasformato Breaking Bad in un anime – ed è terrificante
  • IA analogica? Sembra pazzesco, ma potrebbe essere il futuro
  • Ecco cosa fa un'A.I. che analizza le tendenze. pensa che sarà la prossima grande novità nel campo della tecnologia
  • Il futuro dell'intelligenza artificiale: 4 grandi cose a cui prestare attenzione nei prossimi anni
  • Architettura algoritmica: dovremmo lasciare che l’A.I. progettare edifici per noi?