क्या ए.आई. लुप्त भाषाओं के रहस्य को सुलझाने में मदद करें?

फ्रांसेस्को रिकार्डो इकोमिनो/गेटी इमेजेज़

ऐसी कई चीज़ें हैं जो मनुष्य को अन्य प्रजातियों से अलग करती हैं, लेकिन सबसे महत्वपूर्ण चीज़ों में से एक है भाषा। विभिन्न तत्वों को अनिवार्य रूप से अनंत संयोजनों में एक साथ पिरोने की क्षमता एक ऐसा गुण है जिसे "अतीत में अक्सर माना जाता रहा है।" आधुनिक मानव की मुख्य परिभाषित विशेषता, मानव रचनात्मकता, सांस्कृतिक संवर्धन और जटिल सामाजिक संरचना का स्रोत,'' भाषाविद् नोम चॉम्स्की ने एक बार कहा था कहा।

अंतर्वस्तु

  • मृतकों को पुनर्जीवित करना (भाषाएँ)
  • भविष्य

लेकिन मनुष्य के विकास में भाषा जितनी महत्वपूर्ण रही है, भाषा का विकास कैसे हुआ, इसके बारे में हम अभी भी बहुत कुछ नहीं जानते हैं। जबकि लैटिन जैसी मृत भाषाओं में लिखित अभिलेखों और वंशजों का खजाना है जिसके माध्यम से हम इसे बेहतर ढंग से समझ सकते हैं, कुछ भाषाएँ इतिहास में खो गई हैं।

अनुशंसित वीडियो

शोधकर्ता कुछ खोई हुई भाषाओं का पुनर्निर्माण करने में सक्षम हुए हैं, लेकिन उन्हें समझने की प्रक्रिया लंबी हो सकती है। उदाहरण के लिए, प्राचीन लिपि लीनियर बी को इसकी खोज के आधी शताब्दी के बाद "हल" कर दिया गया था, और जिन लोगों ने इस पर काम किया उनमें से कुछ लोग इस काम को पूरा होते देखने के लिए जीवित नहीं रहे। लीनियर ए नामक एक पुरानी लिपि, मिनोअन सभ्यता की लेखन प्रणाली, अनिर्धारित रहती है।

संबंधित

  • डिजिटल ट्रेंड्स टेक फॉर चेंज सीईएस 2023 अवार्ड्स
  • मज़ेदार फ़ॉर्मूला: क्यों मशीन से उत्पन्न हास्य ए.आई. की पवित्र कब्र है?
  • ए.आई. का अत्यंत सुंदर 'सिंथेटिक शास्त्र' पढ़ें। वह सोचता है कि यह भगवान है

हालाँकि, आधुनिक भाषाविदों के पास एक शक्तिशाली उपकरण है: कृत्रिम बुद्धिमत्ता। प्रशिक्षण द्वारा ए.आई. अनिर्धारित भाषाओं में पैटर्न का पता लगाने के लिए, शोधकर्ता प्राचीन दुनिया के रहस्यों को उजागर करते हुए, उनका पुनर्निर्माण कर सकते हैं। मैसाचुसेट्स इंस्टीट्यूट ऑफ टेक्नोलॉजी (एमआईटी) के शोधकर्ताओं द्वारा हाल ही में एक नया तंत्रिका दृष्टिकोण अपनाया गया है लीनियर बी को समझने में पहले ही सफलता मिल चुकी है, और एक दिन अन्य खोई हुई समस्याओं को हल करने में मदद मिल सकती है भाषाएँ।

मृतकों को पुनर्जीवित करना (भाषाएँ)

बिल्ली की खाल उतारने की तरह, किसी खोई हुई भाषा को डिकोड करने के एक से अधिक तरीके हैं। कुछ मामलों में, भाषा का कोई लिखित रिकॉर्ड नहीं होता है, इसलिए भाषाविद् इसके वंशजों के माध्यम से ध्वनियों के विकास का पता लगाकर इसका पुनर्निर्माण करने का प्रयास करते हैं। प्रोटो-इंडो-यूरोपियन, जो यूरोप और एशिया की अनेक भाषाओं का काल्पनिक पूर्वज है, का मामला भी ऐसा ही है।

अन्य मामलों में, पुरातत्वविद् लिखित अभिलेखों का पता लगाते हैं, जो कि लीनियर बी के मामले में था। पुरातत्वविदों द्वारा क्रेते द्वीप पर गोलियों की खोज के बाद, शोधकर्ताओं ने दशकों तक उन लेखों पर विचार किया और अंततः इसका अर्थ निकाला। दुर्भाग्य से, लीनियर ए के साथ यह फिलहाल संभव नहीं है, क्योंकि शोधकर्ताओं के पास अध्ययन के लिए उतनी स्रोत सामग्री नहीं है। लेकिन यह आवश्यक नहीं हो सकता है.

लेकिन अंग्रेजी और फ्रेंच सदियों से सांस्कृतिक ओवरलैप के साथ जीवित भाषाएं हैं। किसी खोई हुई भाषा को समझना कहीं अधिक पेचीदा है।

एमआईटी के शोधकर्ताओं का एक प्रोजेक्ट समझने की कठिनाइयों के साथ-साथ ए.आई. की क्षमता को भी दर्शाता है। क्षेत्र में क्रांति लाने के लिए. शोधकर्ताओं ने खोई हुई भाषाओं को समझने के लिए "ऐतिहासिक भाषा विज्ञान में प्रलेखित भाषा परिवर्तन के पैटर्न के आधार पर" एक तंत्रिका दृष्टिकोण विकसित किया। जैसा कि इसमें विस्तार से बताया गया है 2019 का एक पेपर, जबकि पिछले ए.आई. समझने के लिए भाषाओं को एक विशिष्ट भाषा के अनुरूप बनाना पड़ता है, लेकिन ऐसा नहीं है।

"यदि आप किसी व्यावसायिक रूप से उपलब्ध अनुवादक या अनुवाद उत्पाद को देखते हैं," प्रमुख जियामिंग लुओ कहते हैं कागज पर लेखक, “इन सभी तकनीकों की बड़ी संख्या में पहुंच है जिसे हम समानांतर कहते हैं डेटा। आप इन्हें रोसेटा स्टोन्स के रूप में सोच सकते हैं, लेकिन बहुत बड़ी मात्रा में।

एक समानांतर कोष दो अलग-अलग भाषाओं में ग्रंथों का एक संग्रह है। उदाहरण के लिए, अंग्रेजी और फ्रेंच दोनों में वाक्यों की एक श्रृंखला की कल्पना करें। भले ही आप फ़्रेंच नहीं जानते हों, दो सेटों की तुलना करके और पैटर्न देखकर, आप एक भाषा के शब्दों को दूसरी भाषा के समकक्ष शब्दों पर मैप कर सकते हैं।

लुओ बताते हैं, "यदि आप एक इंसान को ऐसा करने के लिए प्रशिक्षित करते हैं, यदि आप 40 मिलियन से अधिक समानांतर वाक्य देखते हैं," मुझे विश्वास है कि आप अनुवाद का पता लगाने में सक्षम होंगे।

लेकिन अंग्रेजी और फ्रेंच सदियों से सांस्कृतिक ओवरलैप के साथ जीवित भाषाएं हैं। किसी खोई हुई भाषा को समझना कहीं अधिक पेचीदा है।

लुओ बताते हैं, "हमारे पास समानांतर डेटा की विलासिता नहीं है।" "इसलिए हमें कुछ विशिष्ट भाषाई ज्ञान पर निर्भर रहना होगा कि भाषा कैसे विकसित होती है, शब्द अपने वंशजों में कैसे विकसित होते हैं।"

तंत्रिका गूढ़ीकरण/एमआईटी

एक ऐसा मॉडल बनाने के लिए जिसका उपयोग शामिल भाषाओं की परवाह किए बिना किया जा सकता है, टीम ने उन रुझानों के आधार पर बाधाएं निर्धारित कीं जिन्हें भाषाओं के विकास के माध्यम से देखा जा सकता है।

लुओ कहते हैं, "हमें भाषाविज्ञान पर अंतर्दृष्टि के दो स्तरों पर भरोसा करना होगा।" “एक चरित्र स्तर पर है, जिसे हम सभी जानते हैं कि जब शब्द विकसित होते हैं, तो वे आमतौर पर बाएं से दाएं विकसित होते हैं। आप इस विकास के बारे में एक स्ट्रिंग की तरह सोच सकते हैं। तो हो सकता है कि लैटिन में एक स्ट्रिंग एबीसीडीई हो, सबसे अधिक संभावना है कि आप इसे एबीडी या एबीसी में बदलने जा रहे थे, फिर भी आप एक तरह से मूल क्रम को सुरक्षित रखते हैं। इसे हम मोनोटोनिक कहते हैं।"

शब्दावली के स्तर पर (वे शब्द जिनसे भाषा बनती है), टीम ने "वन-टू-वन मैपिंग" नामक तकनीक का उपयोग किया।

"इसका मतलब है कि यदि आप लैटिन की पूरी शब्दावली को बाहर निकालते हैं और इतालवी की पूरी शब्दावली को बाहर निकालते हैं, तो आपको कुछ प्रकार का एक-से-एक मिलान दिखाई देगा," लुओ एक उदाहरण के रूप में प्रस्तुत करता है। "'कुत्ते' के लिए लैटिन शब्द संभवतः 'कुत्ते' के लिए इतालवी शब्द में विकसित होगा और 'बिल्ली' के लिए लैटिन शब्द संभवतः 'बिल्ली' के लिए इतालवी शब्द में विकसित होगा।"

मॉडल का परीक्षण करने के लिए, टीम ने कुछ डेटासेट का उपयोग किया। उन्होंने प्राचीन भाषा युगारिटिक का हिब्रू, लीनियर बी से ग्रीक में अनुवाद किया और मॉडल की प्रभावकारिता की पुष्टि करने के लिए, रोमांस भाषाओं स्पेनिश, इतालवी और के भीतर सजातीय (सामान्य वंश वाले शब्द) का पता लगाया पुर्तगाली.

यह लीनियर बी को स्वचालित रूप से समझने का पहला ज्ञात प्रयास था, और मॉडल ने 67.3% संज्ञेय का सफलतापूर्वक अनुवाद किया। उगारिटिक के अनुवाद के लिए सिस्टम में पिछले मॉडलों से भी सुधार हुआ है। यह देखते हुए कि भाषाएँ विभिन्न परिवारों से आती हैं, यह दर्शाता है कि मॉडल लचीला है, साथ ही पिछली प्रणालियों की तुलना में अधिक सटीक है।

भविष्य

लीनियर ए भाषा के महान रहस्यों में से एक बना हुआ है, और उस प्राचीन रहस्य को तोड़ना एक बड़ी बात होगी ए.आई. के लिए उल्लेखनीय उपलब्धि फिलहाल, लुओ कहते हैं, एक जोड़े के लिए ऐसा कुछ पूरी तरह से सैद्धांतिक है कारण.

सबसे पहले, लीनियर ए, लीनियर बी की तुलना में कम मात्रा में डेटा प्रदान करता है। यह पता लगाने की भी बात है कि लीनियर ए सम किस प्रकार की स्क्रिप्ट है।

लुओ कहते हैं, "मैं कहूंगा कि लीनियर ए के लिए अनोखी चुनौती यह है कि आपके पास बहुत सारे चित्रात्मक या लॉगोग्राफ़िक पात्र या प्रतीक हैं।" "और आमतौर पर जब आपके पास इनमें से बहुत सारे प्रतीक होंगे, तो यह बहुत कठिन होगा।"

ब्रांड एक्स पिक्चर्स/गेटी इमेजेज

उदाहरण के तौर पर, लुओ अंग्रेजी और चीनी की तुलना करता है।

“यदि आप बड़े अक्षरों की गणना न करें तो अंग्रेजी में 26 अक्षर हैं, और रूसी में 33 अक्षर हैं। इन्हें वर्णमाला प्रणाली कहा जाता है। तो आपको बस इन 26 या 30-कुछ पात्रों के लिए एक मानचित्र का पता लगाना होगा,'' वह कहते हैं।

"लेकिन चीनियों के लिए, आपको उनमें से हजारों से निपटना होगा," वह आगे कहते हैं। “मुझे लगता है कि एक अखबार पढ़ने के लिए न्यूनतम पात्रों में महारत हासिल करने का अनुमान लगभग 3,000 या 5,000 होगा। लीनियर ए चीनी नहीं है, लेकिन इसके सचित्र या लोगोग्राफ़िक प्रतीकों और उस जैसी चीज़ों के कारण, यह लीनियर बी की तुलना में निश्चित रूप से कठिन है।

हालाँकि लीनियर ए अभी भी अस्पष्ट है, लेकिन एमआईटी के नवीन तंत्रिका गूढ़लेखन दृष्टिकोण की सफलता अभी भी अस्पष्ट है समानांतर कॉर्पस की आवश्यकता से आगे बढ़ते हुए, रैखिक बी को स्वचालित रूप से समझना एक आशाजनक है संकेत।

संपादकों की सिफ़ारिशें

  • एआई ने ब्रेकिंग बैड को एनीमे में बदल दिया - और यह डरावना है
  • एनालॉग ए.आई.? यह पागलपन जैसा लगता है, लेकिन यह भविष्य हो सकता है
  • यहाँ एक प्रवृत्ति-विश्लेषण करने वाला ए.आई. है। सोचता है कि टेक में अगली बड़ी चीज़ होगी
  • ए.आई. का भविष्य: अगले कुछ वर्षों में देखने लायक 4 बड़ी चीज़ें
  • एल्गोरिथम वास्तुकला: क्या हमें ए.आई. को अनुमति देनी चाहिए? हमारे लिए इमारतें डिज़ाइन करें?

श्रेणियाँ

हाल का

Hisense, Huawei, और चीनी निर्माताओं का उदय

Hisense, Huawei, और चीनी निर्माताओं का उदय

2013 कंज्यूमर इलेक्ट्रॉनिक्स शो का सबसे बड़ा चल...

हुआवेई: हम सुरक्षा के लिए खतरा नहीं हैं, हम सिर्फ एक मोहरा हैं

हुआवेई: हम सुरक्षा के लिए खतरा नहीं हैं, हम सिर्फ एक मोहरा हैं

कुछ महीने पहले, अधिकांश अमेरिकियों ने हुआवेई के...