एमआईटी का नवीनतम ए.आई. वीडियो में क्या चल रहा है यह निर्धारित करने में अद्भुत है

एक टेम्पोरल रिलेशन नेटवर्क कैसे समझता है कि वहां क्या हो रहा है

हमें यह समझने के लिए कि क्या हो रहा है, कहानी कहने वाली जानकारी के कुछ फ्रेम ही पर्याप्त हैं। आख़िरकार, यह कॉमिक पुस्तकों का आधार है - जो हमें जो कुछ हुआ है उसका अनुसरण करने के लिए पर्याप्त महत्वपूर्ण कहानी प्रदान करता है। अफसोस की बात है कि कंप्यूटर विज़न तकनीक से लैस रोबोट ऐसा करने के लिए संघर्ष करते हैं। अब तक, कम से कम.

अनुशंसित वीडियो

हाल ही में मैसाचुसेट्स इंस्टीट्यूट ऑफ टेक्नोलॉजी (MIT) ने एक नए प्रकार की कृत्रिम बुद्धिमत्ता का प्रदर्शन किया सिस्टम जो वीडियो फ्रेम में रिक्त स्थान को भरने के लिए एक तंत्रिका नेटवर्क का उपयोग करता है ताकि यह पता लगाया जा सके कि कौन सी गतिविधि हो रही है जगह। परिणाम यह निर्धारित करने में आश्चर्यजनक रूप से अच्छे हैं कि वीडियो में क्या हो रहा है।

“नए विकसित टेम्पोरल रिलेशन मॉड्यूल ए.आई. को सक्षम बनाते हैं। कुछ प्रमुख फ़्रेमों का विश्लेषण करने और अस्थायी का अनुमान लगाने की प्रणाली उनके बीच संबंध, यह समझने के लिए कि वीडियो में क्या चल रहा है - जैसे कि वस्तुओं का ढेर [गिराया जा रहा है]," बोलेई झोउ

, एक पूर्व पीएच.डी. एमआईटी के कंप्यूटर साइंस एंड आर्टिफिशियल इंटेलिजेंस लेबोरेटरी (सीएसएआईएल) के छात्र, जो अब हांगकांग के चीनी विश्वविद्यालय में कंप्यूटर विज्ञान के सहायक प्रोफेसर हैं, ने डिजिटल ट्रेंड्स को बताया। "चूंकि मॉडल आने वाले वीडियो से कम नमूने वाले मुख्य फ़्रेमों के साथ काम करता है, प्रसंस्करण दक्षता में काफी सुधार होता है, जिससे वास्तविक समय गतिविधि पहचान सक्षम हो जाती है।"

ए.आई. की एक और रोमांचक संपत्ति। मॉडल यह है कि यह वीडियो के फ़्रेम देखकर पहले ही अनुमान लगा सकता है और अनुमान लगा सकता है कि क्या होगा। उदाहरण के लिए, यदि यह किसी व्यक्ति को बोतल पकड़े हुए देखता है, तो एल्गोरिदम अनुमान लगाता है कि वे पेय ले सकते हैं या संभवतः उसे निचोड़ सकते हैं। जैसे डोमेन में उपयोग की जाने वाली कृत्रिम बुद्धिमत्ता के लिए ऐसी प्रत्याशा क्षमताएँ आवश्यक होंगी स्वायत्त ड्राइविंग, जहां यह पल-पल क्या होगा इसका अनुमान लगाकर सक्रिय रूप से दुर्घटनाओं को रोक सकता है।

झोउ ने आगे कहा, "इसका उपयोग मानव व्यवहार की निगरानी के लिए भी किया जा सकता है, जैसे कि एक घरेलू रोबोट सहायक जो चीजों को पहले से वितरित करके आपके इरादे का अनुमान लगा सकता है।" "बेहतर वीडियो समझ और वीडियो पुनर्प्राप्ति करने के लिए ऑनलाइन बड़े पैमाने पर [संख्या] वीडियो का विश्लेषण करने के लिए इसे [अतिरिक्त रूप से नियोजित किया जा सकता है]।"

परियोजना के अगले चरण में व्यापक संख्या में वस्तुओं और गतिविधियों को पहचानने के लिए ए.आई. की क्षमता को बढ़ाना शामिल होगा। टीम इस गतिविधि पहचान को रोबोट सिस्टम में तैनात करने के लिए रोबोटिक्स शोधकर्ताओं के साथ भी काम कर रही है। इसके परिणामस्वरूप धारणा और दृश्य तर्क कौशल में वृद्धि देखी जा सकती है।

संपादकों की सिफ़ारिशें

कोई भी AMD के ज़ेन 4 चिप्स नहीं खरीदना चाहता - क्या हो रहा है?
ज़ूम का A.I. कॉल के दौरान भावनाओं का पता लगाने की तकनीक आलोचकों को परेशान करती है
मज़ेदार फ़ॉर्मूला: क्यों मशीन से उत्पन्न हास्य ए.आई. की पवित्र कब्र है?
एनवीडिया ने ए.आई. में प्रवेश की बाधा कम कर दी है। फ्लीट कमांड और लॉन्चपैड के साथ
आईबीएम का ए.आई. मेफ्लावर जहाज अटलांटिक पार कर रहा है, और आप इसे लाइव देख सकते हैं

अपनी जीवनशैली को उन्नत करेंडिजिटल ट्रेंड्स पाठकों को सभी नवीनतम समाचारों, मजेदार उत्पाद समीक्षाओं, व्यावहारिक संपादकीय और एक तरह की अनूठी झलक के साथ तकनीक की तेज़ गति वाली दुनिया पर नज़र रखने में मदद करता है।

एमआईटी का नवीनतम ए.आई. वीडियो में क्या चल रहा है यह निर्धारित करने में अद्भुत है

संपादकों की सिफ़ारिशें

श्रेणियाँ

हाल का

मेटा ने पुष्टि की है कि वह इंस्टाग्राम के लिए BeReal क्लोन बना रहा है

व्हाट्सएप ज़ूम के दो बेहतरीन वीडियो-कॉलिंग फीचर्स की नकल कर रहा है

AI के गॉडफादर ने तकनीक पर अधिक स्वतंत्र रूप से बोलने के लिए Google को छोड़ दिया