On palju asju, mis eristavad inimest teistest liikidest, kuid üks olulisemaid on keel. Võimalus ühendada erinevaid elemente sisuliselt lõpmatuteks kombinatsioonideks on omadus, mida "on sageli minevikus peetud Kaasaegsete inimeste põhiline tunnusjoon, inimese loovuse, kultuurilise rikastamise ja keerulise sotsiaalse struktuuri allikas,“ nagu keeleteadlane Noam Chomsky kunagi ütles.
Sisu
- Surnute ülestõusmine (keeled)
- Tulevik
Kuid nii tähtis kui keel on olnud inimeste evolutsioonis, ei tea me veel palju selle kohta, kuidas keel on arenenud. Kui surnud keeltel, nagu ladina keel, on palju kirjalikke ülestähendusi ja järeltulijaid, mille kaudu saame seda paremini mõista, on mõned keeled ajalukku kadunud.
Soovitatavad videod
Teadlastel on õnnestunud rekonstrueerida mõned kadunud keeled, kuid nende dešifreerimine võib olla pikk. Näiteks iidne skript Linear B "lahendati" üle poole sajandi pärast selle avastamist ja mõned selle kallal töötanud inimesed ei elanud töö valmimiseni. Vanem skript nimega Linear A, Minose tsivilisatsiooni kirjutamissüsteem, jääb dešifreerimata.
Seotud
- Digital Trendsi Tech For Change CES 2023 auhinnad
- Naljakas valem: miks masinaga loodud huumor on A.I püha graal?
- Lugege A.I kohutavalt ilusat "sünteetilist pühakirja". kes arvab, et see on jumal
Kaasaegsete keeleteadlaste käsutuses on aga võimas tööriist: tehisintellekt. Koolitades A.I. dešifreerimata keeltes mustrite leidmiseks saavad teadlased need rekonstrueerida, avades iidse maailma saladused. Massachusettsi Tehnoloogiainstituudi (MIT) teadlaste hiljutine uudne neuraalne lähenemisviis on seda teinud on juba näidanud edu lineaarse B dešifreerimisel ja võib ühel päeval viia teiste kaotatud probleemide lahendamiseni keeled.
Surnute ülestõusmine (keeled)
Sarnaselt kassi nülgimisega on kadunud keele dekodeerimiseks rohkem kui üks viis. Mõnel juhul pole keelel kirjalikke ülestähendusi, mistõttu keeleteadlased püüavad seda rekonstrueerida, jälgides helide arengut selle järeltulijate kaudu. Nii on see proto-indoeuroopa keelega, mis on paljude Euroopa ja Aasia keelte hüpoteetiline esivanem.
Muudel juhtudel avastavad arheoloogid kirjalikke ülestähendusi, nagu juhtus Linear B puhul. Pärast seda, kui arheoloogid avastasid Kreeta saarelt tahvlid, veetsid teadlased aastakümneid kirjutisi mõistatades, lõpuks dešifreerides need. Kahjuks ei ole see praegu lineaarse A puhul võimalik, kuna teadlastel pole uurimiseks peaaegu nii palju lähtematerjali. Kuid see ei pruugi olla vajalik.
Kuid inglise ja prantsuse keel on elavad keeled, mille kultuurid on sajandeid kattuvad. Kaotatud keele dešifreerimine on palju keerulisem.
MIT-i teadlaste projekt illustreerib dešifreerimise raskusi ja A.I potentsiaali. valdkonnas revolutsiooniliseks muutmiseks. Teadlased töötasid välja neuraalse lähenemisviisi kadunud keelte dešifreerimiseks, mis on „teavitatud ajaloolises lingvistikas dokumenteeritud keelemuutuste mustritest”. Nagu on üksikasjalikult kirjeldatud 2019. aasta paber, samas kui eelmine A.I. sest keelte dešifreerimine pidi olema kohandatud konkreetse keele jaoks, see ei tee seda.
"Kui vaadata mõnda müügilolevat tõlkijat või tõlketoodet," ütleb juht Jiaming Luo "Kõigil neil tehnoloogiatel on juurdepääs suurele hulgale sellele, mida me nimetame paralleelseks andmeid. Neid võib pidada Rosetta kivideks, kuid väga suures koguses.
Paralleelkorpus on kahes erinevas keeles tekstide kogum. Kujutage ette näiteks rida lauseid nii inglise kui ka prantsuse keeles. Isegi kui te prantsuse keelt ei oska, saate neid kahte komplekti võrreldes ja mustreid vaadeldes vastendada ühes keeles olevad sõnad teise keele samaväärseteks sõnadeks.
"Kui õpetate inimest seda tegema, kui näete 40+ miljonit paralleelset lauset," selgitab Luo, "olen kindel, et suudate tõlke välja mõelda."
Kuid inglise ja prantsuse keel on elavad keeled, mille kultuurid on sajandeid kattuvad. Kaotatud keele dešifreerimine on palju keerulisem.
"Meil pole seda paralleelandmete luksust," selgitab Luo. "Seega peame tuginema teatud keelelistele teadmistele selle kohta, kuidas keel areneb, kuidas sõnadest saavad järglased."
Et luua mudel, mida saaks kasutada sõltumata kaasatud keeltest, seadis meeskond piirangud, mis põhinevad suundumustel, mida saab jälgida läbi keelte arengu.
"Peame tuginema keeleteaduse kahele tasemele, " ütleb Luo. „Üks on tegelaskuju tasandil, mis on kõik, mida me teame, et kui sõnad arenevad, arenevad need tavaliselt vasakult paremale. Võite mõelda sellest arengust kui nöörist. Nii et võib-olla on ladina keeles string ABCDE, mille muutsite tõenäoliselt ABD-ks või ABC-ks, säilitate siiski teatud viisil algse järjestuse. Seda me nimetame monotoonseks."
Sõnavara tasemel (sõnad, mis moodustavad keele) kasutas meeskond tehnikat, mida nimetatakse "üks-ühele kaardistamiseks".
"See tähendab, et kui võtate välja kogu ladina keele ja kogu itaalia keele, näete mingit üks-ühele vastet," pakub Luo näite. "Ladinakeelne sõna "koer" areneb tõenäoliselt itaaliakeelseks sõnaks "koer" ja ladina sõna "kass" tõenäoliselt itaaliakeelseks sõnaks "kass"."
Mudeli testimiseks kasutas meeskond mõnda andmekogumit. Nad tõlkisid iidse keele ugariti heebrea keelde, lineaarse B kreeka keelde ning mudeli tõhususe kinnitamiseks teostas sugulaskeelte (ühise esivanemaga sõnad) tuvastamist romaani keeltes hispaania, itaalia ja portugali keel.
See oli esimene teadaolev katse lineaarset B automaatselt dešifreerida ja mudel tõlkis edukalt 67,3% sugulastest. Süsteem täiustas ka varasemaid ugariti keele tõlkimise mudeleid. Arvestades, et keeled on pärit erinevatest perekondadest, näitab see, et mudel on paindlik ja täpsem kui varasemad süsteemid.
Tulevik
Lineaarne A on endiselt üks keele suuri saladusi ja selle iidse pähkli purustamine oleks a tähelepanuväärne saavutus A.I. Praegu on Luo sõnul midagi sellist paari jaoks täiesti teoreetiline põhjustel.
Esiteks pakub lineaarne A väiksemat hulka andmeid kui isegi lineaarne B. Samuti on vaja välja selgitada, milline skript Linear A isegi on.
"Ma ütleksin, et Lineaarse A ainulaadne väljakutse on see, et teil on palju pildilisi või logograafilisi märke või sümboleid," ütleb Luo. "Ja tavaliselt, kui teil on palju neid sümboleid, on see palju raskem."
Loo võrdleb näiteks inglise ja hiina keelt.
"Inglise keeles on 26 tähte, kui mitte arvestada suurtähti, ja vene keeles on 33 tähte. Neid nimetatakse tähestikusüsteemideks. Nii et peate lihtsalt nende 26- või 30-aastaste tegelaste jaoks kaardi välja mõtlema, ”ütleb ta.
"Kuid hiinlaste jaoks peate tegelema tuhandete nendega," jätkab ta. „Ma arvan, et ajalehe lugemise jaoks oleks minimaalne arv tegelasi umbes 3000 või 5000. Lineaar A ei ole hiina keel, kuid oma piltlike või logograafiliste sümbolite ja muu sellise tõttu on see kindlasti raskem kui lineaarne B.
Kuigi lineaar A on endiselt dešifreerimata, on MIT-i uudse närvidešifreerimise lähenemisviisi edu Lineaar B automaatne dešifreerimine, mis ületab paralleelkorpuse vajaduse, on paljutõotav märk.
Toimetajate soovitused
- AI muutis Breaking Badi animeks – ja see on hirmutav
- Analoog A.I? See kõlab hullumeelselt, kuid see võib olla tulevik
- Siin on, mida trendi analüüsiv A.I. arvab, et see on järgmine suur asi tehnikas
- A.I tulevik: 4 suurt asja, mida järgmise paari aasta jooksul jälgida
- Algoritmiline arhitektuur: kas peaksime laskma A.I. meile hooneid projekteerida?