मेटा ने वीडियो के लिए DALL-E बनाया, और यह डरावना और आश्चर्यजनक दोनों है

मेटा ने एक पागल कृत्रिम बुद्धिमत्ता मॉडल का अनावरण किया जो उपयोगकर्ताओं को अपने टाइप किए गए विवरणों को वीडियो में बदलने की अनुमति देता है। सिस्टम कहा जाता है वीडियो बनाओ और यह वेब पर AI जनित सामग्री के चलन में नवीनतम है।

सिस्टम "समुद्र में लहर पर सर्फिंग करता एक रोबोट" या "मूंगा चट्टान के माध्यम से तैरती हुई जोकर मछली" जैसे संक्षिप्त विवरण स्वीकार करता है और गतिशील रूप से विवरण का एक छोटा GIF उत्पन्न करता है। चुनने के लिए वीडियो की तीन अलग-अलग शैलियाँ भी हैं: अतियथार्थवादी, यथार्थवादी और शैलीबद्ध।

कैनवास पर एक कलाकार की ब्रश पेंटिंग का क्लोज़अप

एक के अनुसार फेसबुक पोस्ट मेटा के सीईओ, मार्क जुकरबर्ग के अनुसार, लिखित पाठ का वीडियो में अनुवाद करना बहुत कठिन है क्योंकि वीडियो को मूवमेंट की आवश्यकता होती है:

अनुशंसित वीडियो

“फ़ोटो की तुलना में वीडियो बनाना बहुत कठिन है क्योंकि प्रत्येक पिक्सेल को सही ढंग से उत्पन्न करने के अलावा, सिस्टम को यह भी अनुमान लगाना होता है कि वे समय के साथ कैसे बदलेंगे। मेक-ए-वीडियो बिना पर्यवेक्षित शिक्षण की एक परत जोड़कर इसे हल करता है जो सिस्टम को भौतिक दुनिया में गति को समझने और इसे पारंपरिक टेक्स्ट-टू-इमेज पीढ़ी पर लागू करने में सक्षम बनाता है।

मेटा की एआई रिसर्च टीम ने लिखा कागज़ यह वर्णन करते हुए कि सिस्टम कैसे काम करता है और यह वर्तमान टेक्स्ट-टू-इमेज (T2I) विधियों से कैसे भिन्न है। अन्य मशीन भाषा मॉडल के विपरीत, मेटा की टेक्स्ट-टू-वीडियो (T2V) विधि पूर्व-परिभाषित टेक्स्ट-वीडियो जोड़े का उपयोग नहीं करती है। उदाहरण के लिए, यह "चलते हुए आदमी" को वास्तविक चलते हुए आदमी के वीडियो के साथ नहीं जोड़ता है।

यदि यह काफी हद तक लोकप्रिय T2I एप्लिकेशन DALL-E जैसा लगता है, तो आप इससे दूर नहीं होंगे। DALL-E की लोकप्रियता बढ़ने के बाद से अन्य T2I एप्लिकेशन भी शुरू हो गए हैं। टिकटॉक ने एक फिल्टर जारी किया अगस्त में एआई ग्रीनस्क्रीन कहा गया जो आपके द्वारा टाइप किए गए शब्दों के आधार पर पेंटिंग शैली की छवियां उत्पन्न करता है।

नारंगी बुना हुआ टोपी पहने एक रोएंदार बच्चा एक लैपटॉप को बंद करने की कोशिश कर रहा है, जिसकी आंखों में अत्यधिक विस्तृत स्टूडियो लाइटिंग स्क्रीन दिखाई दे रही है।

पिछले कुछ वर्षों में AI-जनित सामग्री काफी चर्चा में रही है। डीपफेक तकनीक, एक व्यक्ति के चेहरे को दूसरे के चेहरे से बदलने के लिए मशीन लर्निंग तकनीक, यहां तक कि बड़े बजट के शो के लिए विजुअल इफेक्ट्स स्टूडियो द्वारा भी उपयोग किया जाता है मांडलोरियन.

जुलाई में, द टाइम्स ने गलती से रूस-यूक्रेन युद्ध के बीच एक यूक्रेनी महिला पर रिपोर्ट कर दी। समस्या यह है वह असली नहीं थी.

एआई का ख़तरा शायद यह कोई वास्तविक खतरा नहीं है, लेकिन DALL-E और मेक-ए-वीडियो जैसी परियोजनाएं कुछ दिलचस्प संभावनाओं की मजेदार खोज हैं।

संपादकों की सिफ़ारिशें

Apple का ChatGPT प्रतिद्वंद्वी स्वचालित रूप से आपके लिए कोड लिख सकता है
बिंग इमेज क्रिएटर आपके ब्राउज़र में DALL-E AI-जनरेटेड छवियां लाता है
मैंने एआई वेब खोज का (दूरस्थ) भविष्य देखा है - यहां वह जगह है जहां यह अद्भुत है, और जहां यह संघर्ष करता है
छवि-जनरेटिंग एआई डैल-ई अब किसी के भी साथ खेलने के लिए निःशुल्क है
मैंने अपना हास्यास्पद स्टार्टअप विचार एक रोबोट वीसी के सामने रखा

अपनी जीवनशैली को उन्नत करेंडिजिटल ट्रेंड्स पाठकों को सभी नवीनतम समाचारों, मजेदार उत्पाद समीक्षाओं, व्यावहारिक संपादकीय और एक तरह की अनूठी झलक के साथ तकनीक की तेज़ गति वाली दुनिया पर नज़र रखने में मदद करता है।

मेटा ने वीडियो के लिए DALL-E बनाया, और यह डरावना और आश्चर्यजनक दोनों है

संपादकों की सिफ़ारिशें

श्रेणियाँ

हाल का

क्राफ्ट ब्रूअर आपको लगभग एक मिनट में पेय बना देगा

सोर्सफोर्ज विज्ञापन बंडलिंग से जुड़े विवाद को संबोधित करता है

माइक्रोसॉफ्ट ने इंटरनेट एक्सप्लोरर 9 जारी किया