Amazon Alexa जल्द ही आपके मृत रिश्तेदार की आवाज में बोलेगा
New Delhi: कब्र के पार से दोस्तों और रिश्तेदारों से बात करना एक असंभव काम है। लेकिन ऐमजॉन (Amazon Alexa) की वर्चुअल असिस्टेंट एलेक्सा जल्द ही ऐसा कर सकती है। चाहे आपको वह डरावना लगे या सुकून देने वाला, पूरी तरह आप पर निर्भर है।
Meet my pal Astro, a robot designed to the last detail. Can you spot the two identical Astros below? pic.twitter.com/JYaiLr7FpE
— Alexa (@alexa99) May 19, 2022
Amazon Alexa: आवाजों की नकल करने की क्षमता
Amazon के Re: MARS (मशीन लर्निंग, ऑटोमेशन, रोबोट्स एंड स्पेस) सम्मेलन में, एलेक्सा के वरिष्ठ उपाध्यक्ष रोहित प्रसाद ने एक शुरुआती विशेषता का प्रदर्शन किया कि एलेक्सा के पास एक दिन हो सकता है: आवाजों की नकल करने की क्षमता। समान रूप से, या शायद अधिक चौंकाने वाला तथ्य यह है कि यह सुविधा (या कौशल जिसे वे इसे कहते हैं) भी एलेक्सा को उन लोगों की आवाज़ की नकल करने में सक्षम बनाती है जिन्हें हमने खो दिया है या अब हमारे साथ नहीं हैं।
अमेज़ॅन ने इस कार्यक्षमता को एक रिकॉर्ड किए गए वीडियो के रूप में भी प्रदर्शित किया। प्रदर्शन वीडियो में, एक बच्चा कहता है, “एलेक्सा, क्या दादी मुझे द विजार्ड ऑफ ओज़ पढ़ना समाप्त कर सकती हैं?”। सीएनबीसी ने बताया कि अनुरोध सुनने पर, एलेक्सा अपनी सामान्य आवाज में बच्चे के अनुरोध को स्वीकार करती है, जिसके बाद वह कहानी को उस आवाज में पढ़ना शुरू कर देती है जो बच्चे की मृत दादी के समान होती है।
हालांकि यह सीमावर्ती डरावना लग सकता है, लेकिन कंपनी के वार्षिक कार्यक्रम में प्रसाद ने इस कार्यक्षमता को यादों को संरक्षित करने के तरीके के रूप में पेश किया। अमेज़ॅन का कहना है कि एलेक्सा की यह कार्यक्षमता लोगों की आवाज़ की नकल करने के लिए ‘नुकसान के दर्द को खत्म नहीं कर सकती’, यह निश्चित रूप से ‘यादों को अंतिम बना सकती है’।
Amazon Alexa: कैसे काम करता है यह फीचर?
यदि आप उत्सुक हैं कि यह सुविधा कैसे काम करती है, तो अमेज़ॅन ने Engadget को बताया कि एलेक्सा का नया कौशल व्यक्तिगत आवाज के एक मिनट के ऑडियो पर प्रशिक्षित होने के बाद किसी व्यक्ति की आवाज का सिंथेटिक वॉयसप्रिंट बना सकता है। कंपनी ने टेक्स्ट-टू-स्पीच तकनीक में जो प्रगति की है, वह इसे शक्ति प्रदान करता है। अमेज़ॅन ने हाल ही में इन विकासों का विवरण देते हुए एक श्वेतपत्र भी साझा किया जिसमें कहा गया था कि एक ‘वॉयस फ़िल्टर’ आवाज को दोहराने के लिए एलेक्सा के लिए एक मिनट के रूप में कम से कम भाषण का उपयोग कर सकता है।
“अत्याधुनिक टेक्स्ट-टू-स्पीच (टीटीएस) सिस्टम को उच्च गुणवत्ता वाले सिंथेटिक भाषण उत्पन्न करने के लिए रिकॉर्ड किए गए भाषण डेटा के कई घंटों की आवश्यकता होती है … इस पेपर में, हम वॉयस फ़िल्टर नामक एक उपन्यास बेहद कम-संसाधन टीटीएस विधि प्रस्तावित करते हैं जो लक्षित वक्ता के कम से कम एक मिनट के भाषण का उपयोग करता है। यह पहले से मौजूद उच्च-गुणवत्ता वाले टीटीएस सिस्टम से जुड़े पोस्ट-प्रोसेसिंग मॉड्यूल के रूप में वॉयस कन्वर्जन (वीसी) का उपयोग करता है और मौजूदा टीटीएस प्रतिमान में एक वैचारिक बदलाव को चिह्नित करता है, जो कुछ-शॉट टीटीएस समस्या को वीसी कार्य के रूप में तैयार करता है, ”कंपनी श्वेत पत्र में लिखा है।
लेकिन चिंताएं हैं
हालांकि यह सब काफी अच्छा लगता है, चीजें उतनी सरल नहीं हैं जितनी वे लगती हैं। विशेषज्ञ लंबे समय से उन उपकरणों के बारे में चिंतित हैं जिनका उपयोग गहरे नकली वीडियो में आवाजों की नकल करने के लिए किया जाता है। यद्यपि यह कौशल अभी भी विकास में है और यह स्पष्ट नहीं है कि क्या अमेज़ॅन विश्व स्तर पर अपने उपयोगकर्ताओं को जारी करेगा, यह इस तकनीक के बारे में चिंता व्यक्त करता है कि स्कैमर्स और साइबर अपराधियों द्वारा इसका दुरुपयोग किया जा रहा है।
यह भी पढ़े: 5G Spectrum bid: 26 जुलाई को होगी 5जी स्पेक्ट्रम की नीलामी