შეუძლია A.I. დაეხმარეთ დაკარგული ენების საიდუმლოს ამოხსნაში?

ფრანჩესკო რიკარდო იაკომინო / გეტის სურათები

ბევრი რამ განასხვავებს ადამიანს სხვა სახეობებისგან, მაგრამ ერთ-ერთი ყველაზე მნიშვნელოვანი ენაა. სხვადასხვა ელემენტების არსებითად უსასრულო კომბინაციებში შეერთების უნარი არის თვისება, რომელიც „წარსულში ხშირად ითვლებოდა თანამედროვე ადამიანების ძირითადი განმსაზღვრელი მახასიათებელი, ადამიანის შემოქმედების წყარო, კულტურული გამდიდრება და რთული სოციალური სტრუქტურა, როგორც ერთხელ ენათმეცნიერი ნოამ ჩომსკი. განაცხადა.

შინაარსი

  • მკვდრების აღდგომა (ენები)
  • Მომავალი

მაგრამ რამდენადაც მნიშვნელოვანია ენა ადამიანთა ევოლუციაში, ჯერ კიდევ ბევრი რამ არ ვიცით იმის შესახებ, თუ როგორ განვითარდა ენა. მიუხედავად იმისა, რომ მკვდარ ენებს, როგორიცაა ლათინური, აქვთ უამრავი წერილობითი ჩანაწერი და შთამომავალი, რომლის მეშვეობითაც ჩვენ შეგვიძლია უკეთ გავიგოთ იგი, ზოგიერთი ენა ისტორიაში დაკარგულია.

რეკომენდებული ვიდეოები

მკვლევარებმა შეძლეს ზოგიერთი დაკარგული ენის აღდგენა, მაგრამ მათი გაშიფვრის პროცესი შეიძლება ხანგრძლივი იყოს. მაგალითად, უძველესი დამწერლობა Linear B „მოიხსნა“ აღმოჩენიდან ნახევარ საუკუნეზე მეტი ხნის შემდეგ და ზოგიერთმა მათგანმა, ვინც მასზე მუშაობდა, არ იცოცხლა, რომ ნამუშევარი დასრულებულიყო. ძველი დამწერლობა სახელად Linear A, მინოსური ცივილიზაციის დამწერლობის სისტემა, გაუშიფრავი რჩება.

დაკავშირებული

  • ციფრული ტენდენციების Tech For Change CES 2023 ჯილდოები
  • სასაცილო ფორმულა: რატომ არის მანქანით წარმოქმნილი იუმორი A.I.-ს წმინდა გრაალი.
  • წაიკითხეთ A.I.-ის საოცრად ლამაზი "სინთეზური წერილი". რომ ფიქრობს, რომ ღმერთია

თუმცა, თანამედროვე ენათმეცნიერებს აქვთ ძლიერი ინსტრუმენტი: ხელოვნური ინტელექტი. ვარჯიშით A.I. გაშიფრულ ენებზე შაბლონების დასადგენად, მკვლევარებს შეუძლიათ მათი რეკონსტრუქცია, ანტიკური სამყაროს საიდუმლოებების გახსნა. მასაჩუსეტსის ტექნოლოგიური ინსტიტუტის (MIT) მკვლევართა ბოლო, ახალი ნერვული მიდგომა აქვს უკვე აჩვენა წარმატება Linear B-ის გაშიფვრაში და შეიძლება ერთ დღეს მიგვიყვანოს სხვა დაკარგულის ამოხსნამდე ენები.

მკვდრების აღდგომა (ენები)

ისევე როგორც კატის ტყავს, დაკარგული ენის გაშიფვრის ერთზე მეტი გზა არსებობს. ზოგიერთ შემთხვევაში, ენას არ აქვს წერილობითი ჩანაწერები, ამიტომ ენათმეცნიერები ცდილობენ მის რეკონსტრუქციას ბგერების ევოლუციის მიკვლევით მისი შთამომავლების მეშვეობით. ასეთია პროტო-ინდოევროპული, ევროპისა და აზიის მრავალი ენის ჰიპოთეტური წინაპარი.

სხვა შემთხვევებში, არქეოლოგებმა აღმოაჩინეს წერილობითი ჩანაწერები, რაც იყო Linear B-ის შემთხვევაში. მას შემდეგ, რაც კუნძულ კრეტაზე არქეოლოგებმა აღმოაჩინეს ტაბლეტები, მკვლევარებმა ათწლეულები გაატარეს საგონებელში ჩაწერილი ნაწერების გამო და საბოლოოდ გაშიფრეს. სამწუხაროდ, ეს ამჟამად შეუძლებელია Linear A-ით, რადგან მკვლევარებს არ აქვთ იმდენი წყარო მასალა შესასწავლად. მაგრამ ეს შეიძლება არ იყოს საჭირო.

მაგრამ ინგლისური და ფრანგული არის ცოცხალი ენები საუკუნეების კულტურული გადახურვით. დაკარგული ენის გაშიფვრა გაცილებით რთულია.

MIT-ის მკვლევართა პროექტი ასახავს გაშიფვრის სირთულეებს, ასევე A.I-ს პოტენციალს. დარგის რევოლუციას. მკვლევარებმა შეიმუშავეს ნერვული მიდგომა დაკარგული ენების გაშიფვრისთვის, „ინფორმირებული ისტორიულ ლინგვისტიკაში დოკუმენტირებული ენის ცვლილების შაბლონებით“. როგორც დაწვრილებით 2019 წლის ნაშრომი, ხოლო წინა ა.ი. რადგან ენების გაშიფვრა კონკრეტულ ენაზე უნდა ყოფილიყო მორგებული, ეს ასე არ არის.

„თუ შეხედავთ კომერციულად ხელმისაწვდომ მთარგმნელს ან მთარგმნელ პროდუქტს“, ამბობს ჯიამინგ ლუო, წამყვანი ავტორი ქაღალდზე, „ყველა ამ ტექნოლოგიას აქვს წვდომა დიდი რაოდენობით რასაც ჩვენ პარალელურს ვუწოდებთ მონაცემები. თქვენ შეგიძლიათ წარმოიდგინოთ ისინი, როგორც როზეტას ქვები, მაგრამ ძალიან დიდი რაოდენობით. ”

პარალელური კორპუსი არის ტექსტების კრებული ორ სხვადასხვა ენაზე. წარმოიდგინეთ, მაგალითად, წინადადებების სერია ინგლისურ და ფრანგულ ენებზე. მაშინაც კი, თუ თქვენ არ იცით ფრანგული, ამ ორი ნაკრების შედარებით და ნიმუშების დაკვირვებით, შეგიძლიათ ერთ ენაზე შეაფასოთ სიტყვები სხვა ექვივალენტურ სიტყვებზე.

„თუ თქვენ ავარჯიშებთ ადამიანს ამის გაკეთებაში, თუ ხედავთ 40-ზე მეტ პარალელურ წინადადებას“, განმარტავს ლუო, „დარწმუნებული ვარ, რომ თქვენ შეძლებთ თარგმანის გარკვევას“.

მაგრამ ინგლისური და ფრანგული არის ცოცხალი ენები საუკუნეების კულტურული გადახურვით. დაკარგული ენის გაშიფვრა გაცილებით რთულია.

”ჩვენ არ გვაქვს პარალელური მონაცემების ფუფუნება”, - განმარტავს ლუო. ”ასე რომ, ჩვენ უნდა დავეყრდნოთ გარკვეულ ენობრივ ცოდნას იმის შესახებ, თუ როგორ ვითარდება ენა, როგორ ვითარდებიან სიტყვები მათ შთამომავლებად.”

ნერვული გაშიფვრა/MIT

იმისათვის, რომ შეიქმნას მოდელი, რომლის გამოყენებაც შესაძლებელი იქნებოდა ჩართული ენების მიუხედავად, გუნდმა დააწესა შეზღუდვები ტენდენციებზე დაყრდნობით, რომლებიც შეიძლება შეინიშნოს ენების ევოლუციაში.

„ჩვენ უნდა დავეყრდნოთ ლინგვისტიკის ორი დონის ცოდნას“, - ამბობს ლუო. „ერთი არის პერსონაჟის დონეზე, რაც ჩვენ ვიცით, რომ როდესაც სიტყვები ვითარდება, ისინი ჩვეულებრივ ვითარდებიან მარცხნიდან მარჯვნივ. თქვენ შეგიძლიათ იფიქროთ ამ ევოლუციაზე, როგორც სიმებიანი. ასე რომ, შესაძლოა, ლათინური სტრიქონი არის ABCDE, რომელიც, სავარაუდოდ, თქვენ აპირებდით მის შეცვლას ABD-ზე ან ABC-ზე, თქვენ მაინც შეინარჩუნებთ ორიგინალურ წესრიგს. ეს არის ის, რასაც ჩვენ ვუწოდებთ მონოტონურს."

ლექსიკის დონეზე (სიტყვები, რომლებიც ქმნიან ენას), გუნდმა გამოიყენა ტექნიკა, სახელწოდებით "ერთი-ერთზე რუქა".

"ეს ნიშნავს, რომ თუ თქვენ ამოიღებთ ლათინური ენის მთელ ლექსიკას და ამოიღებთ იტალიურის მთელ ლექსიკას, თქვენ ნახავთ ერთ-ერთ შესაბამისობას", - გვთავაზობს ლუო მაგალითად. ლათინური სიტყვა "ძაღლი" ალბათ გადაიქცევა იტალიურ სიტყვაში "ძაღლი" და ლათინური სიტყვა "კატა" ალბათ გადაიქცევა იტალიურ სიტყვაში "კატა".

მოდელის შესამოწმებლად გუნდმა გამოიყენა რამდენიმე მონაცემთა ნაკრები. მათ თარგმნეს ძველი უგარითული ენა ებრაულად, ხაზოვანი B ბერძნულად და მოდელის ეფექტურობის დასადასტურებლად, შეასრულა მონათესავე (სიტყვები საერთო წარმოშობის მქონე) რომანულ ენებში ესპანური, იტალიური და პორტუგალიური.

ეს იყო პირველი ცნობილი მცდელობა ხაზოვანი B-ის ავტომატურად გაშიფვრისა და მოდელმა წარმატებით თარგმნა მონათესავეთა 67,3%. სისტემა ასევე გაუმჯობესდა უგარითულის თარგმნის წინა მოდელებზე. იმის გათვალისწინებით, რომ ენები სხვადასხვა ოჯახიდან მოდის, ეს აჩვენებს, რომ მოდელი არის მოქნილი და უფრო ზუსტი ვიდრე წინა სისტემები.

Მომავალი

ხაზოვანი A რჩება ენის ერთ-ერთ დიდ საიდუმლოდ და ამ უძველესი თხილის გატეხვა ა აღსანიშნავია A.I. ამჟამად, ლუო ამბობს, რომ მსგავსი რაღაც სრულიად თეორიულია წყვილისთვის მიზეზები.

პირველი, Linear A გთავაზობთ უფრო მცირე რაოდენობას, ვიდრე ხაზოვანი B. ასევე არის იმის გარკვევა, თუ რა სახის დამწერლობაა Linear A.

”მე ვიტყოდი, რომ ხაზოვანი A-სთვის უნიკალური გამოწვევა არის ის, რომ თქვენ გაქვთ ბევრი ფერწერული ან ლოგოგრაფიული სიმბოლო ან სიმბოლო,” - ამბობს ლუო. ”და ჩვეულებრივ, როდესაც თქვენ გაქვთ ბევრი ასეთი სიმბოლო, ეს ბევრად უფრო რთული იქნება.”

ბრენდი X Pictures/Getty Images

მაგალითად, ლუო ადარებს ინგლისურს და ჩინურს.

„ინგლისურს აქვს 26 ასო, თუ არ ჩავთვლით კაპიტალიზაციას, ხოლო რუსულს აქვს 33. მათ ანბანურ სისტემებს უწოდებენ. ასე რომ, თქვენ უბრალოდ უნდა გაარკვიოთ რუკა ამ 26 ან 30-იანი სიმბოლოსთვის,” - ამბობს ის.

”მაგრამ ჩინელებისთვის, თქვენ უნდა გაუმკლავდეთ ათასობით მათგანს,” განაგრძობს ის. „ვფიქრობ, გაზეთის წასაკითხად დასაუფლებელი სიმბოლოების მინიმალური რაოდენობა იქნება დაახლოებით 3000 ან 5000. ხაზოვანი A არ არის ჩინური, მაგრამ მისი ფერწერული ან ლოგოგრაფიული სიმბოლოების და მსგავსი ნივთების გამო, ის ნამდვილად უფრო რთულია ვიდრე ხაზოვანი B.

მიუხედავად იმისა, რომ ხაზოვანი A ჯერ კიდევ გაუშიფრულია, MIT-ის ახალი ნერვული გაშიფვრის მიდგომის წარმატება ხაზოვანი B-ს ავტომატურად გაშიფვრა, პარალელური კორპუსის საჭიროების მიღმა, პერსპექტიულია ნიშანი.

რედაქტორების რეკომენდაციები

  • AI-მა Breaking Bad ანიმედ აქცია - და ეს საშინელებაა
  • ანალოგი A.I.? ეს გიჟურად ჟღერს, მაგრამ ეს შეიძლება იყოს მომავალი
  • აი, რა ტენდენციას აანალიზებს A.I. ფიქრობს, რომ იქნება შემდეგი დიდი რამ ტექნოლოგიაში
  • A.I.-ს მომავალი: 4 დიდი რამ, რასაც უნდა უყუროთ მომდევნო რამდენიმე წელიწადში
  • ალგორითმული არქიტექტურა: უნდა დავუშვათ A.I. შენობების დიზაინი ჩვენთვის?

კატეგორიები

Ბოლო

დევიდ ჰარბორი თავის ახალ საშობაო ფილმზე Violent Night

დევიდ ჰარბორი თავის ახალ საშობაო ფილმზე Violent Night

მოემზადეთ თოვლის ბაბუისთვის, რათა დღე მუშტებით ...

რატომ არ მინდა შევწყვიტო Google Pixel 7 Pro-ის გამოყენება

რატომ არ მინდა შევწყვიტო Google Pixel 7 Pro-ის გამოყენება

დღეს მე უნდა ამოვიღო SIM ბარათი ჩემი ამჟამინდელ...