फेसबुक ए.आई. वीडियो चैट ऐप्स में कष्टप्रद समस्या को ठीक किया जा सकता है

फेसबुक पर संचार मुख्य रूप से पाठ के माध्यम से किया जा सकता है, लेकिन फिर भी सोशल मीडिया दिग्गज ऑडियो संचार के साथ कुछ सबसे बड़ी चुनौतियों को हल करने में मदद कर सकता है। से पहले शुक्रवार, 10 जुलाई को घोषणा की गई मशीन लर्निंग पर अंतर्राष्ट्रीय सम्मेलन,फेसबुक ने एक नया विकसित किया है, अत्याधुनिक कृत्रिम बुद्धिमत्ता यह एक साथ बोलने वाली पांच आवाजों में अंतर करने में सक्षम है।

यह अगली पीढ़ी के श्रवण यंत्रों या स्मार्ट स्पीकर से लेकर डायल करने और कुछ को प्रवर्धित करने तक हर चीज के लिए परिवर्तनकारी हो सकता है भविष्य में ज़ूम-शैली वीडियो कॉन्फ्रेंसिंग के लिए आवाज़ें वक्ताओं को बेहतर प्राथमिकता देना सीखें ताकि हर किसी को एक-दूसरे पर बात करने से रोका जा सके अन्य।

अनुशंसित वीडियो

"यह वाक् पृथक्करण के लिए एक पर्यवेक्षित शिक्षण दृष्टिकोण है," एलिया नचमानी, FAIR में एक शोध सहायक (फेसबुक ए.आई. रिसर्च) तेल अवीव ने डिजिटल ट्रेंड्स को बताया। “पहली बार, हम दिखा रहे हैं कि एक माइक्रोफोन रिकॉर्डिंग से पांच अलग-अलग स्पीकर को अलग करना संभव है। हम यह भी दिखा रहे हैं कि कैसे मॉडल रिकॉर्डिंग में स्पीकर की संख्या का पता लगा सकता है और उसके अनुसार प्री-फॉर्म कर सकता है। मॉडल मास्क-मुक्त है, जिसका अर्थ है कि हम मास्किंग का अनुमान नहीं लगाते हैं जो अन्य आवाज़ों को हटा देता है। इसके बजाय, हमारा मॉडल अन्य आवाज़ों या पृष्ठभूमि शोर को फ़िल्टर करना सीखता है।

2 स्पीकर वॉयस सेपरेशन एनीमेशन फाइनल

यह "मास्क-मुक्त" तत्व महत्वपूर्ण है। प्रभावशाली बेंचमार्क हासिल करने वाले पिछले मॉडल अन्य आवाज़ों को हटाने के लिए मास्क का उपयोग करते हैं। इस दृष्टिकोण के साथ समस्या यह है कि जैसे-जैसे स्पीकर की संख्या बढ़ती है या अज्ञात होती है, मॉडल खराब हो जाते हैं। जबकि फेसबुक के मॉडल को अभी भी स्पीकर की संख्या निर्दिष्ट करने की आवश्यकता है, यह कुछ स्मार्ट तकनीक का उपयोग करता है स्वचालित रूप से उन लोगों की संख्या का पता लगाएं जो बात कर रहे हैं और फिर काम करने के लिए सबसे उपयुक्त मॉडल का चयन करें वह नंबर.

नचमानी ने बताया कि इस भाषण पृथक्करण तकनीक के अन्य अनुप्रयोग भी हो सकते हैं। आवाज़ों को अलग करने के अलावा, यह पृष्ठभूमि शोर से अन्य ध्वनियों को भी क्रमबद्ध कर सकता है। उदाहरण के लिए, वह इसकी अनुमति दे सकता है विभिन्न संगीत वाद्ययंत्रों को अलग करें एक ही ऑडियो फ़ाइल से.

क्या इस तकनीक में से कोई भी जल्द ही फेसबुक उत्पाद में अपना रास्ता खोज लेगा? इतना तो स्पष्ट नहीं है. यह मौलिक ए.आई. है अनुसंधान जो जरूरी नहीं कि भविष्य में बनाया जाएगा फेसबुक अनुप्रयोग। लेकिन यह देखना निश्चित रूप से आसान है कि ऐसा उपकरण कैसे उपयोगी हो सकता है। मान लें कि फेसबुक पहले से ही विभिन्न वीडियो और वॉयस चैट सुविधाएँ प्रदान करता है, यह संभावना के दायरे से बाहर नहीं है कि यह भविष्य में किसी समय भविष्य के उत्पाद में अपना रास्ता बना सकता है।

यह ए.आई. प्रदर्शन उन 30 से अधिक पेपरों में से एक है जिन पर फेसबुक मशीन लर्निंग पर अंतर्राष्ट्रीय सम्मेलन में चर्चा कर रहा है, जो इस सप्ताह के अंत में शुरू हो रहा है।

संपादकों की सिफ़ारिशें

  • ट्विटर ने अभी-अभी अपनी सबसे कष्टप्रद समस्याओं में से एक को ठीक किया है
  • निंटेंडो ए.आई. का उपयोग कैसे कर सकता है? स्विच प्रो में 4K गेमिंग लाने के लिए
  • चतुर नया ए.आई. जब आप घर से दूर होंगे तो सिस्टम आपके कुत्ते को प्रशिक्षित करने का वादा करता है
  • यह बुनियादी मानव कौशल ए.आई. के लिए अगला प्रमुख मील का पत्थर है।
  • जीटीसी 2020 राउंडअप: रोबोट के लिए एनवीडिया की आभासी दुनिया, ए.आई. वीडियो कॉल्स

अपनी जीवनशैली को उन्नत करेंडिजिटल ट्रेंड्स पाठकों को सभी नवीनतम समाचारों, मजेदार उत्पाद समीक्षाओं, व्यावहारिक संपादकीय और एक तरह की अनूठी झलक के साथ तकनीक की तेज़ गति वाली दुनिया पर नज़र रखने में मदद करता है।

श्रेणियाँ

हाल का