यह यथार्थवादी संश्लेषित भाषण ऑडियोबुक का भविष्य हो सकता है

सिरी और एलेक्सा द्वारा उपयोग की जाने वाली संश्लेषित आवाजें हमें दिन के मौसम का पूर्वानुमान या कैसे बताएं, के लिए ठीक हैं खाना पकाने के टाइमर पर कई मिनट बचे हैं, लेकिन क्या आप वास्तव में चाहेंगे कि उनके सपाट, नीरस स्वर आपको पढ़ें ऑडियो पुस्तकें? शायद नहीं, यही कारण है कि हममें से अधिकांश लोग अपने ऑडियोबुक को ठीक करने के लिए ऑडिबल जैसी मानव-आवाज़ वाली सेवाओं की ओर रुख करते हैं। हालाँकि, लंदन स्थित स्टार्टअप के अग्रणी काम के कारण मानव आवाज अभिनेताओं को बहुत अधिक समय तक मंजूरी नहीं मिल सकती है डीपज़ेन.

की तकनीकी मारक क्षमता द्वारा संवर्धित कृत्रिम बुद्धिमत्ता एल्गोरिदम का उपयोग करना आईबीएम की पावर ए.आई. और वाटसन प्रौद्योगिकियाँ, डीपज़ेन ने टेक्स्ट-टू-स्पीच टूल विकसित किया है जो न केवल पहली बार सुनने में मानवीय लगता है, बल्कि आकर्षक तरीके से टेक्स्ट पढ़ने के लिए आवश्यक भावनात्मक संकेतों को भी पकड़ सकता है। ऐसा करने पर, कंपनी का दावा है कि इससे ऑडियोबुक बनाने में लगने वाला समय और लागत 90% तक कम हो सकती है।

अनुशंसित वीडियो

डीपज़ेन के सीईओ और सह-संस्थापक टायलान कामिस ने डिजिटल ट्रेंड्स को बताया, "हमारा सिस्टम वास्तव में क्रांतिकारी है।" “यह गहन शिक्षण और तंत्रिका नेटवर्क का उपयोग करके यह समझने के लिए काम करता है कि मनुष्य कैसे बात करता है और पढ़ता है। फिर हम सिस्टम को प्रशिक्षित करते हैं ताकि यह पहचान सके कि पाठ के एक टुकड़े को पढ़ते समय सही भावनाओं और स्वर को कहाँ लागू किया जाए। इसका परिणाम यह होता है कि मानवीय वाणी वास्तविक चीज़ से बहुत मिलती-जुलती होती है।''

संबंधित

  • ऑप्टिकल भ्रम हमें एआई की अगली पीढ़ी बनाने में मदद कर सकता है
  • अंतिम स्पर्श: कैसे वैज्ञानिक रोबोटों को मानव जैसी स्पर्श संवेदना दे रहे हैं
  • ए.आई. का अत्यंत सुंदर 'सिंथेटिक शास्त्र' पढ़ें। वह सोचता है कि यह भगवान है

अनिवार्य रूप से, इस तरह के काम को अत्याधुनिक ए.आई. का एक और उदाहरण माना जा सकता है। औजार एक मानवीय पेशे को खतरे में डालना. इस मामले में, उस पेशे में ऐसे अभिनेता शामिल होते हैं, जो कुछ हाई-प्रोफाइल हस्तियों को हासिल करने में सक्षम होने के बावजूद, सबसे स्थिर, स्थिर करियर नहीं रखते हैं। यह सोचना मूर्खतापूर्ण होगा कि इस तरह के सॉफ़्टवेयर का वॉयस एक्टर्स के भविष्य पर कोई प्रभाव नहीं पड़ेगा, लेकिन, जैसा कि कामिस बताते हैं, ऐसे कई परिदृश्य हैं जिनमें डीपज़ेन जैसे उपकरण शुद्ध रूप से सकारात्मक हो सकते हैं इंसानियत।

उदाहरण के लिए, यह नए और उभरते लेखकों या ऐसे प्रकाशकों के कार्यों के आधार पर ऑडियोबुक का निर्माण संभव बना सकता है जिनके पास बड़े बजट की विलासिता नहीं है। इसका उपयोग डिस्लेक्सिया से पीड़ित या अन्यथा पढ़ने में परेशानी वाले लोगों के लिए बेहतर टेक्स्ट-टू-स्पीच टूल विकसित करने में मदद के लिए भी किया जा सकता है।

जहां तक ​​भविष्य की बात है, हम वीडियो उत्पादन उद्योग के लिए वॉयस-ओवर तैयार करने पर भी विचार कर रहे हैं गेमिंग के साथ-साथ, जहां खिलाड़ी के अनुभव को बढ़ाने के लिए रीयल-टाइम टेक्स्ट-टू-स्पीच की आवश्यकता होती है,'' कामी कहा। "हम अन्य भाषाओं पर भी विचार कर रहे हैं।"

आप सिस्टम का एक नमूना देख सकते हैं यहाँ.

संपादकों की सिफ़ारिशें

  • सुरक्षा रोबोट आपके निकट किसी स्कूल में आ सकते हैं
  • जब कोई AI वास्तव में संवेदनशील हो जाएगा तो हमें कैसे पता चलेगा?
  • एनालॉग ए.आई.? यह पागलपन जैसा लगता है, लेकिन यह भविष्य हो सकता है
  • ए.आई. का भविष्य: अगले कुछ वर्षों में देखने लायक 4 बड़ी चीज़ें
  • यह तकनीक 20 साल पहले विज्ञान कथा थी। अब यह हकीकत है

अपनी जीवनशैली को उन्नत करेंडिजिटल ट्रेंड्स पाठकों को सभी नवीनतम समाचारों, मजेदार उत्पाद समीक्षाओं, व्यावहारिक संपादकीय और एक तरह की अनूठी झलक के साथ तकनीक की तेज़ गति वाली दुनिया पर नज़र रखने में मदद करता है।

श्रेणियाँ

हाल का

मैकमिलन स्क्रिब्ड और ऑयस्टर से जुड़ गया, किंडल अनलिमिटेड से दूर हो गया

मैकमिलन स्क्रिब्ड और ऑयस्टर से जुड़ गया, किंडल अनलिमिटेड से दूर हो गया

ईबुक सदस्यता युद्ध गर्म हो रहे हैं। हालाँकि अमे...

विथिंग्स एक्टिविट और पॉप नाउ एंड्रॉइड को सपोर्ट करते हैं

विथिंग्स एक्टिविट और पॉप नाउ एंड्रॉइड को सपोर्ट करते हैं

MWC 2023 की हमारी संपूर्ण कवरेज देखेंविथिंग्स ए...

स्विस घड़ी निर्माता जून में बेहतर घड़ियाँ पेश करेंगे

स्विस घड़ी निर्माता जून में बेहतर घड़ियाँ पेश करेंगे

वॉचमेकर सिटीजन फॉसिल ग्रुप की तकनीक का उपयोग कर...