On monia asioita, jotka erottavat ihmiset muista lajeista, mutta yksi tärkeimmistä on kieli. Kyky yhdistää erilaisia elementtejä olennaisesti äärettömiin yhdistelmiin on ominaisuus, jota "on usein pidetty menneisyydessä nykyihmisen keskeinen määrittävä piirre, ihmisen luovuuden, kulttuurisen rikastumisen ja monimutkaisen sosiaalisen rakenteen lähde”, kielitieteilijä Noam Chomsky kerran sanoi.
Sisällys
- Kuolleiden ylösnousemus (kielet)
- Tulevaisuus
Mutta niin tärkeä kuin kieli on ollut ihmisten evoluutiossa, emme vieläkään tiedä, miten kieli on kehittynyt. Vaikka latinan kaltaisilla kuolleilla kielillä on runsaasti kirjallisia todisteita ja jälkeläisiä, joiden avulla voimme paremmin ymmärtää sitä, jotkut kielet ovat kadonneet historiaan.
Suositellut videot
Tutkijat ovat pystyneet rekonstruoimaan joitakin kadonneita kieliä, mutta niiden purkaminen voi olla pitkä. Esimerkiksi muinainen käsikirjoitus Linear B "ratkaistiin" yli puoli vuosisataa sen löytämisen jälkeen, ja jotkut sen parissa työskennelleistä eivät ehtineet nähdä työn valmistumista. Vanhempi käsikirjoitus nimeltä Linear A, minolaisen sivilisaation kirjoitusjärjestelmä, on edelleen salaamatta.
Liittyvät
- Digital Trendsin Tech For Change CES 2023 -palkinnot
- Hauska kaava: Miksi koneella luotu huumori on A.I: n pyhä malja?
- Lue aavemaisen kaunista A.I: n synteettistä kirjoitusta. joka luulee olevansa Jumala
Nykyaikaisilla kielitieteilijillä on kuitenkin käytössään tehokas työkalu: tekoäly. Kouluttamalla A.I. paikantaakseen kuviot salaamattomilla kielillä, tutkijat voivat rekonstruoida ne ja paljastaa muinaisen maailman salaisuudet. Massachusetts Institute of Technologyn (MIT) tutkijoiden äskettäinen uusi hermolähestymistapa on tehnyt on jo osoittanut menestystä lineaarisen B: n tulkinnassa, ja se voi jonakin päivänä johtaa muiden kadonneiden ratkaisemiseen Kieli (kielet.
Kuolleiden ylösnousemus (kielet)
Aivan kuten kissan nylkeminen, kadonneen kielen purkamiseen on useampi kuin yksi tapa. Joissakin tapauksissa kielellä ei ole kirjallisia muistiinpanoja, joten kielitieteilijät yrittävät rekonstruoida sen jäljittämällä äänien kehitystä sen jälkeläisten kautta. Näin on protoindoeurooppalaisen kielen tapauksessa, joka on monien Euroopan ja Aasian kielten hypoteettinen esi-isä.
Muissa tapauksissa arkeologit kaivaavat esiin kirjallisia asiakirjoja, kuten Linear B: n tapauksessa. Sen jälkeen kun arkeologit löysivät tauluja Kreetan saarelta, tutkijat viettivät vuosikymmeniä ihmetellen kirjoituksia ja lopulta salasivat ne. Valitettavasti tämä ei ole tällä hetkellä mahdollista Lineaarisella A: lla, koska tutkijoilla ei ole läheskään yhtä paljon tutkittavaa lähdemateriaalia. Mutta se ei ehkä ole välttämätöntä.
Mutta englanti ja ranska ovat eläviä kieliä, joilla on vuosisatoja kulttuurista päällekkäisyyttä. Kadonneen kielen purkaminen on paljon hankalampaa.
MIT: n tutkijoiden projekti havainnollistaa tulkinnan vaikeuksia sekä A.I: n mahdollisuuksia. mullistamaan alan. Tutkijat kehittivät neuraalisen lähestymistavan kadonneiden kielten tulkitsemiseen "historiallisen kielitieteen dokumentoitujen kielenmuutosmallien perusteella". Kuten kohdassa on kuvattu vuoden 2019 lehti, kun taas edellinen A.I. koska kielten tulkinta oli räätälöitävä tietylle kielelle, tämä ei ole.
"Jos tarkastelet mitä tahansa kaupallisesti saatavilla olevaa kääntäjää tai käännöstuotetta", sanoo johtaja Jiaming Luo kirjoittaja paperilla, "kaikilla näillä tekniikoilla on pääsy suureen määrään, mitä kutsumme rinnakkain tiedot. Voit ajatella niitä Rosetta-kivinä, mutta erittäin suuria määriä.
Rinnakkaiskorpus on kokoelma tekstejä kahdella eri kielellä. Kuvittele esimerkiksi sarja lauseita sekä englanniksi että ranskaksi. Vaikka et osaisi ranskaa, vertailemalla kahta joukkoa ja tarkkailemalla kuvioita, voit yhdistää yhden kielen sanoja vastaaviin sanoihin toisessa.
"Jos koulutat ihmisen tekemään tämän, jos näet yli 40 miljoonaa rinnakkaista lausetta", Luo selittää. "Olen varma, että pystyt keksimään käännöksen."
Mutta englanti ja ranska ovat eläviä kieliä, joilla on vuosisatoja kulttuurista päällekkäisyyttä. Kadonneen kielen purkaminen on paljon hankalampaa.
"Meillä ei ole sitä ylellisyyttä rinnakkaisten tietojen kanssa", Luo selittää. "Joten meidän täytyy luottaa tiettyyn kielelliseen tietoon siitä, kuinka kieli kehittyy, kuinka sanat kehittyvät jälkeläisiksi."
Luodakseen mallin, jota voidaan käyttää kielistä riippumatta, tiimi asetti rajoituksia kielten kehityksen kautta havaittavien trendien perusteella.
"Meidän täytyy luottaa kahdelle tasolle kielitieteen oivalluksiin", Luo sanoo. ”Yksi on hahmotasolla, minkä tiedämme vain, että kun sanat kehittyvät, ne yleensä kehittyvät vasemmalta oikealle. Voit ajatella tätä kehitystä eräänlaisena merkkijonona. Joten ehkä latinankielinen merkkijono on ABCDE, jonka todennäköisesti aiot muuttaa ABD: ksi tai ABC: ksi, säilytät silti alkuperäisen järjestyksen jollain tavalla. Sitä me kutsumme monotoniseksi."
Sanaston tasolla (sanat, jotka muodostavat kielen) ryhmä käytti tekniikkaa nimeltä "yksi-yhteen-kartoitus".
"Se tarkoittaa, että jos vedät esiin koko latinan sanaston ja vedät pois koko italian sanaston, näet jonkinlaisen yksitellen vastaavuuden", Luo tarjoaa esimerkkinä. "Latinankielinen sana "koira" kehittyy todennäköisesti italian sanaksi "koira" ja latinalainen sana "kissa" todennäköisesti kehittyy italian sanaksi "kissa".
Mallin testaamiseen tiimi käytti muutamia tietojoukkoja. He käänsivät muinaisen kielen ugaritiksi hepreaksi, lineaarista B kreikaksi ja vahvistaakseen mallin tehokkuuden, suoritti sukulaisuuden (sanojen, joilla on yhteisiä esi-isiä) havaitsemisen romaanisilla kielillä espanja, italia ja Portugalin kieli.
Se oli ensimmäinen tunnettu yritys tulkita automaattisesti lineaarista B: tä, ja malli käänsi onnistuneesti 67,3 % sukulaisista. Järjestelmä on myös parantunut aiempiin Ugaritic-käännösmalleihin verrattuna. Koska kielet tulevat eri perheistä, se osoittaa, että malli on joustava ja tarkempi kuin aikaisemmat järjestelmät.
Tulevaisuus
Lineaarinen A on edelleen yksi kielen suurimmista mysteereistä, ja sen muinaisen pähkinän murtaminen olisi a merkittävä saavutus A.I. Luo sanoo, että toistaiseksi sellainen on täysin teoreettista, pariskunnalle syyt.
Ensinnäkin lineaarinen A tarjoaa pienemmän määrän dataa kuin jopa lineaarinen B. On myös selvitettävä, millainen käsikirjoitus Linear A jopa on.
"Sanoisin, että Lineaari A: n ainutlaatuinen haaste on, että sinulla on paljon kuvallisia tai logollisia merkkejä tai symboleja", Luo sanoo. "Ja yleensä kun sinulla on paljon näitä symboleja, se on paljon vaikeampaa."
Esimerkkinä Luo vertaa englantia ja kiinaa.
"Englannissa on 26 kirjainta, jos ei lasketa isoja kirjaimia, ja venäjässä 33. Näitä kutsutaan aakkosjärjestelmiksi. Joten sinun on vain keksittävä kartta näille 26 tai 30-vuotiaille hahmoille, hän sanoo.
"Mutta kiinalaisten täytyy olla tekemisissä tuhansien kanssa", hän jatkaa. "Luulen, että arviolta 3 000 tai 5 000 merkkiä, jotka pitäisi hallita vain lukeakseen sanomalehteä. Lineaarinen A ei ole kiinalaista, mutta sen kuvallisten tai logografisten symbolien ja muiden vastaavien asioiden vuoksi se on ehdottomasti vaikeampaa kuin Linear B."
Vaikka lineaarista A: ta ei vieläkään ole salattu, MIT: n uudenlainen hermoston salausmenetelmä onnistui Lineaarin B: n automaattinen tulkinta, joka ylittää rinnakkaiskorpuksen tarpeen, on lupaava merkki.
Toimittajien suositukset
- Tekoäly muutti Breaking Badista animeksi – ja se on pelottavaa
- Analoginen A.I.? Kuulostaa hullulta, mutta se saattaa olla tulevaisuutta
- Tässä on trendejä analysoiva A.I. uskoo olevan seuraava iso asia tekniikassa
- A.I.:n tulevaisuus: 4 suurta asiaa, joita kannattaa huomioida lähivuosina
- Algoritminen arkkitehtuuri: Pitäisikö meidän antaa A.I. suunnitteletko rakennuksia meille?