A.I. Kayıp Dillerin Gizemini Çözmeye Yardım Edin mi?

Francesco Riccardo Iacomino/Getty Images

İnsanları diğer türlerden ayıran pek çok şey vardır ama en önemlilerinden biri dildir. Çeşitli unsurları esasen sonsuz kombinasyonlar halinde bir araya getirme yeteneği, "geçmişte çoğu zaman en önemli şey olarak kabul edilen bir özelliktir." Dilbilimci Noam Chomsky'nin bir zamanlar söylediği gibi, modern insanın temel tanımlayıcı özelliği, insan yaratıcılığının, kültürel zenginleşmenin ve karmaşık sosyal yapının kaynağıdır. söz konusu.

İçindekiler

  • Ölüleri diriltmek (diller)
  • Gelecek

Ancak dil, insanın evriminde ne kadar önemli olsa da, dilin nasıl evrimleştiğine dair hala bilmediğimiz çok şey var. Latince gibi ölü diller, onu daha iyi anlayabileceğimiz zengin yazılı kayıtlara ve torunlara sahip olsa da, bazı diller tarihte kaybolmuştur.

Önerilen Videolar

Araştırmacılar bazı kayıp dilleri yeniden yapılandırmayı başardılar ancak bunları deşifre etme süreci uzun olabiliyor. Örneğin, antik Linear B yazısı, keşfinden yarım yüzyıl sonra "çözüldü" ve üzerinde çalışanlardan bazıları, çalışmanın tamamlandığını görecek kadar yaşamadı. Minos uygarlığının yazı sistemi olan Linear A adı verilen daha eski bir yazının şifresi çözülemedi.

İlgili

  • Dijital Trendlerin Değişim İçin Teknolojisi CES 2023 Ödülleri
  • Komik formül: Makine tarafından üretilen mizah neden yapay zekanın kutsal kâsesidir?
  • Bir A.I.'nin tüyler ürpertici derecede güzel "sentetik kutsal kitabını" okuyun. kendini Tanrı sanan

Ancak modern dilbilimcilerin elinde güçlü bir araç var: Yapay zeka. A.I.'yi eğiterek. Araştırmacılar, şifresi çözülmemiş dillerdeki desenleri bulmak için bunları yeniden inşa ederek antik dünyanın sırlarını açığa çıkarabilirler. Massachusetts Teknoloji Enstitüsü'ndeki (MIT) araştırmacılar tarafından yakın zamanda geliştirilen yeni bir sinirsel yaklaşım, Linear B'yi çözmede zaten başarı gösterdi ve bir gün diğer kayıpların çözülmesine yol açabilir Diller.

Ölüleri diriltmek (diller)

Tıpkı bir kedinin derisini yüzmeye benzer şekilde, kayıp bir dili çözmenin birden fazla yolu vardır. Bazı durumlarda dilin yazılı kayıtları yoktur, bu nedenle dilbilimciler seslerin soyundan gelen evrimin izini sürerek onu yeniden yapılandırmaya çalışırlar. Avrupa ve Asya'daki birçok dilin varsayımsal atası olan Proto-Hint-Avrupa dili için de durum aynıdır.

Diğer durumlarda arkeologlar, Linear B'de olduğu gibi yazılı kayıtları ortaya çıkarırlar. Arkeologlar Girit adasında tabletleri keşfettikten sonra, araştırmacılar onlarca yıl boyunca yazılar üzerinde kafa yormaya çalıştılar ve sonunda şifreyi çözdüler. Ne yazık ki araştırmacıların üzerinde çalışacak çok fazla kaynak materyali olmadığından bu şu anda Linear A ile mümkün değil. Ancak bu gerekli olmayabilir.

Ancak İngilizce ve Fransızca yüzyıllardır süren kültürel örtüşmelere sahip yaşayan dillerdir. Kayıp bir dilin şifresini çözmek çok daha zordur.

MIT'deki araştırmacıların hazırladığı bir proje, şifre çözmenin zorluklarını ve aynı zamanda yapay zekanın potansiyelini gösteriyor. alanda devrim yaratmak. Araştırmacılar, kayıp dillerin şifresini çözmek için "tarihsel dilbilimde belgelenen dil değişimi kalıplarından yola çıkarak" sinirsel bir yaklaşım geliştirdiler. Ayrıntılı olarak belirtildiği gibi 2019 tarihli bir makale, önceki A.I. dillerin şifresini çözmek için belirli bir dile göre uyarlanması gerekiyordu, bu durum böyle değil.

Lider Jiaming Luo, "Piyasada satılan herhangi bir çevirmene veya çeviri ürününe bakarsanız" diyor. makalenin yazarı, "bu teknolojilerin tümü, paralel dediğimiz çok sayıda şeye erişime sahip" veri. Bunları Rosetta Taşları olarak düşünebilirsiniz ama çok büyük miktarlarda.”

Paralel külliyat, iki farklı dildeki metinlerin bir koleksiyonudur. Örneğin hem İngilizce hem de Fransızca bir dizi cümle düşünün. Fransızca bilmiyor olsanız bile, iki grubu karşılaştırarak ve kalıpları gözlemleyerek bir dildeki kelimeleri diğer dildeki eşdeğer kelimelerle eşleştirebilirsiniz.

Luo şöyle açıklıyor: "Bir insanı bunu yapması için eğitirseniz, 40 milyondan fazla paralel cümle görürseniz, bir çeviriyi çözebileceğinizden eminim."

Ancak İngilizce ve Fransızca yüzyıllardır süren kültürel örtüşmelere sahip yaşayan dillerdir. Kayıp bir dilin şifresini çözmek çok daha zordur.

Luo, "Paralel veri elde etme lüksümüz yok" diye açıklıyor. "Dolayısıyla dilin nasıl geliştiği, kelimelerin nasıl evrimleştiği konusunda bazı spesifik dilbilimsel bilgilere güvenmek zorundayız."

Sinirsel Şifre Çözme/MIT

İlgili dillerden bağımsız olarak kullanılabilecek bir model oluşturmak amacıyla ekip, dillerin evrimi yoluyla gözlemlenebilecek eğilimlere dayalı kısıtlamalar belirledi.

Luo, "Dilbilimle ilgili iki düzeyde anlayışa güvenmek zorundayız" diyor. “Biri karakter seviyesinde; bildiğimiz tek şey bu, kelimeler geliştikçe genellikle soldan sağa doğru gelişiyorlar. Bu evrimi bir çeşit ip gibi düşünebilirsiniz. Yani belki Latince bir dizi ABCDE'dir, büyük ihtimalle bunu ABD veya ABC olarak değiştireceksiniz, yine de bir şekilde orijinal sırasını koruyorsunuz. Monotonluk dediğimiz şey budur.”

Ekip, kelime bilgisi (bir dili oluşturan kelimeler) düzeyinde "bire bir haritalama" adı verilen bir teknik kullandı.

Luo, "Bu, Latince'nin tüm kelime dağarcığını ve İtalyanca'nın tüm kelime dağarcığını çıkarırsanız, bir tür birebir eşleşme göreceğiniz anlamına geliyor" diye örnek veriyor Luo. "Latince 'köpek' kelimesi muhtemelen İtalyanca 'köpek' kelimesine ve Latince 'kedi' kelimesi muhtemelen İtalyanca 'kedi' kelimesine dönüşecektir."

Modeli test etmek için ekip birkaç veri kümesi kullandı. Antik dil olan Ugarit dilini İbraniceye, Linear B dilini Yunancaya tercüme ettiler ve modelin etkinliğini teyit ettiler. İspanyolca, İtalyanca ve Roman dillerinde aynı kökenli (ortak kökene sahip kelimeler) tespitini gerçekleştirdi. Portekizce.

Bu, Linear B'yi otomatik olarak deşifre etmeye yönelik bilinen ilk girişimdi ve model, aynı kökenden gelenlerin %67,3'ünü başarıyla tercüme etti. Sistem aynı zamanda Ugaritik çeviriye yönelik önceki modellere göre de geliştirildi. Dillerin farklı ailelerden geldiği göz önüne alındığında, modelin esnek olduğu kadar önceki sistemlerden daha doğru olduğu da görülüyor.

Gelecek

Doğrusal A, dilin en büyük gizemlerinden biri olmaya devam ediyor ve bu kadim cevizi kırmak, A.I. için dikkate değer bir başarı Luo, şimdilik böyle bir şeyin bir çift için tamamen teorik olduğunu söylüyor. sebepler.

Birincisi, Doğrusal A, Doğrusal B'den bile daha az miktarda veri sunar. Ayrıca Linear A'nın ne tür bir senaryo olduğunu bulma meselesi de var.

Luo, "Linear A'nın benzersiz zorluğunun çok sayıda resimsel veya logografik karaktere veya sembole sahip olmanız olduğunu söyleyebilirim" diyor. "Ve genellikle bu sembollerden çok sayıda olduğunda, bu çok daha zor olacaktır."

Marka X Resimleri/Getty Images

Örnek olarak Luo, İngilizce ile Çince'yi karşılaştırıyor.

“Büyük harfleri saymazsanız İngilizcede 26 harf var, Rusçada ise 33. Bunlara alfabetik sistemler denir. Yani bu 26 ya da 30'luk karakterler için bir harita bulmanız gerekiyor" diyor.

"Fakat Çinliler için binlercesiyle uğraşmak zorundasınız" diye devam ediyor. “Sadece bir gazete okumak için ustalaşılması gereken minimum karakter miktarının tahminen 3.000 veya 5.000 olacağını düşünüyorum. Linear A Çince değil ama resimsel veya logografik semboller ve bunun gibi şeyler nedeniyle Linear B'den kesinlikle daha zor.”

Linear A'nın şifresi hala çözülmemiş olmasına rağmen, MIT'nin yeni sinirsel şifre çözme yaklaşımının başarısı Linear B'yi otomatik olarak deşifre etmek, paralel bir külliyata duyulan ihtiyacın ötesine geçerek umut verici bir gelişmedir. imza.

Editörlerin Önerileri

  • Yapay Zeka, Breaking Bad'i bir animeye dönüştürdü ve bu çok korkutucu
  • Analog yapay zeka mı? Çılgınca gelebilir ama gelecek olabilir
  • Trend analizi yapan bir yapay zekanın yaptığı şey şu: teknolojideki bir sonraki büyük şey olacağını düşünüyor
  • Yapay zekanın geleceği: Önümüzdeki birkaç yılda dikkat edilmesi gereken 4 büyük şey
  • Algoritmik mimari: A.I.'ye izin vermeli miyiz? Bizim için bina mı tasarlıyorsunuz?