Artificial Intelligence: आर्टीफीशियल इंटेलिजेंस का कमाल, अब फोटो से निकलेगी आवाजें
Artificial Intelligence: अमेरिका में बोस्टन स्थित नॉर्थईस्टर्न यूनिवर्सिटी में इलेक्ट्रिकल और कंप्यूटर इंजीनियरिंग और कंप्यूटर विज्ञान के प्रोफेसर केविन फू ने चित्रों और यहां तक कि म्यूट किए गए वीडियो से ऑडियो प्राप्त करने का एक तरीका निकाला है।
Artificial Intelligence: कहावत पुरानी है कि "फोटो भी बोलती हैं।" लेकिन अब न सिर्फ फोटो वाकई में बोलेगी बल्कि फोटो खींचते वक्त बैकग्राउंड में जो भी आवाज हुई थी, वह सब निकाली और सुनी जा सकेगी। यही नहीं, आप किसी वीडियो कॉल में अपने को म्यूट करेंगे तो भी सब कुछ सुना जा सकेगा। ये कोई कल्पना या साइंस फिक्शन की बात नहीं बल्कि साइंस और आर्टिफीशियल इंटेलिजेंस का कमाल है।
साइड आई का कमाल
अमेरिका में बोस्टन स्थित नॉर्थईस्टर्न यूनिवर्सिटी में इलेक्ट्रिकल और कंप्यूटर इंजीनियरिंग और कंप्यूटर विज्ञान के प्रोफेसर केविन फू ने चित्रों और यहां तक कि म्यूट किए गए वीडियो से ऑडियो प्राप्त करने का एक तरीका निकाला है। उन्होंने अपनी टीम के साथ मिलकर "साइड आई" नामक एक मशीन लर्निंग सहायक उपकरण बनाया है। साइड आई के जरिये प्रोफेसर फू उस कमरे में बोले गए सटीक शब्दों को बता सकते हैं जहाँ फोटो खींची गई थी।
प्रोफेसर फू कहते हैं कि - "कल्पना कीजिए कि कोई टिकटॉक वीडियो बनाता है और इसे म्यूट करके संगीत डब करता है। लेकिन उसने वीडियो बनाते समय वाकई में क्या बोला था? क्या कोई उनके पीछे बोल रहा था? आप वास्तव में सब जान सकते है कि कैमरे के बाहर क्या बोला गया है।
टीवी शो से मिला आईडिया
प्रोफेसर फू के अनुसार उन्होंने इस खोज का आईडिया "फ्रिंज" नामक एक टीवी शो से मिला था जिसमें दिखाया गया कि किस तरह फोरेंसिक वैज्ञानिकों और एफबीआई की टीम पिघले हुए कांच से आवाजें हासिल कर लेती है। प्रोफेसर फू ने बताया कि ये शो देख कर उन्होंने कहा था - हां क्यों नहीं, ऐसा मुमकिन है। उन्होंने कहा - मेरी प्रयोगशाला असंभव में माहिर है। हम आम तौर पर उम्मीद करते हैं कि हम जो कुछ भी करते हैं उस पर पहली प्रतिक्रिया ये होगी कि 'आप ऐसा नहीं कर सकते' पर हम कहते हैं, 'ठीक है, हम पहले ही ऐसा कर चुके हैं।'
ईइमेज स्टेबिलाइजेशन तकनीक
दरअसल "साइड आई" इमेज स्टेबिलाइजेशन तकनीक का लाभ उठाती है जो अब अधिकांश फोन कैमरों में लगभग स्टैण्डर्ड रूप से इस्तेमाल किया जाता है। यह सुनिश्चित करने के लिए कि हाथ हिलने से धुंधली तस्वीर न आए, कैमरे में छोटे स्प्रिंग होते हैं जो लेंस को लिक्विड में लटकाए रखते हैं। फिर एक इलेक्ट्रोमैग्नेट और सेंसर कैमरे के कंपन को कम करने के लिए लेंस को समान और विपरीत दिशाओं में धकेलते हैं।
कैमरा और कम्पन
प्रोफेसर फू का कहना है कि जब भी कोई कैमरे के लेंस के पास बोलता है, तो यह स्प्रिंग्स में छोटे कंपन पैदा करता है और प्रकाश को थोड़ा मोड़ देता है। प्रकाश का कोण लगभग अगोचर रूप से बदलता है - इतना कि पता नहीं चलता। आम तौर पर, उन सूक्ष्म कंपनों से साउंड वेव निकालना कठिन होता है। लेकिन फू का कहना है कि रोलिंग शटर, फोटोग्राफी की एक विधि है जिसका उपयोग आजकल अधिकांश फोन कैमरे करते हैं, जो वास्तव में असंभव को हासिल करना आसान बनाता है।
फू कहते हैं कि जिस तरह से आज के कैमरों में कॉस्ट कटिंग की जा रही उससे हुआ ये है कि वे एक इमेज के सभी पिक्सेल को एक साथ स्कैन नहीं करते हैं बल्कि वे इसे एक समय में एक लाइन में करते हैं। एक सिंगल फोटो में ऐसा सैकड़ों-हजारों बार होता है। इसका मूल रूप से मतलब यह है कि आप कितनी ही फ्रीक्वेंसी की जानकारी प्राप्त कर सकते हैं। उन्होंने बताया कि जब तक थोड़ी सी भी रोशनी है, साइड आई काम करेगी, हालाँकि जितनी अधिक इमेजरी तक इसकी पहुंच होगी, उतना बेहतर होगा। फू का कहना है कि छत की ओर इशारा करती हुई तस्वीर भी साइड आई को अपना काम करने देगी।
कैसा होगा ऑडियो
इस प्रक्रिया का अंतिम परिणाम ऑडियो है, जो अपने सबसे अच्छे रूप में भी दबी हुई ध्वनि की तरह लगता है। लेकिन कुछ शब्दों और ऑडियो पर मशीन लर्निंग और साइड आई का उपयोग करके, फू बहुत सारी जानकारी निकालने में सक्षम है। साइड आई उस सटीक व्यक्ति की भी पहचान कर सकती है जो बोल रहा है यदि इसे उस व्यक्ति की आवाज पर प्रशिक्षित किया गया है, हालांकि फू का कहना है कि अभी तक यह उतना सटीक नहीं है। साइबर सुरक्षा के दृष्टिकोण से, साइड आई खतरों की एक पूरी तरह से नई दुनिया खोलता है जिसके बारे में लोगों और साइबर सुरक्षा विशेषज्ञों को जागरूक होना चाहिए। हालाँकि, फू का कहना है कि साइड आई के लिए सबसे दिलचस्प एप्लिकेशन वकीलों और आपराधिक कानूनी प्रणाली में काम करने वाले अन्य लोगों के लिए डिजिटल साक्ष्य का एक नया रूप हो सकता है।