November 7, 2024
A.I

Glovatrix, an Indian Startup, Building AI Gloves to Help Speech Impaired Speak again

  • August 18, 2024
  • 1 min read
Glovatrix, an Indian Startup, Building AI Gloves to Help Speech Impaired Speak again

2022 में जनरेटिव आर्टिफिशियल इंटेलिजेंस के वैश्विक विस्फोट के बाद से, यह तकनीक चर्चा का विषय बन गई है। यह केवल बड़े भाषा मॉडल (एलएलएम)-आधारित एआई ही नहीं है, बल्कि प्रौद्योगिकी की सभी विभिन्न शाखाओं ने विकास और अनुप्रयोग दोनों में तेजी से वृद्धि देखी है। एआई ने डिजिटल क्षेत्र को भी छोड़ दिया है और वास्तविक दुनिया में प्रवेश किया है, जिससे लोगों को अपने जीवन को बेहतर बनाने में मदद मिली है। भाषा अनुवाद उपकरणों से लेकर बीमारियों का जल्द पता लगाने तक, इसने समाज के सभी क्षेत्रों को प्रभावित किया है।

पुणे स्थित भारतीय स्टार्टअप ग्लोवेट्रिक्स भी बोलने और सुनने की अक्षमता से पीड़ित लोगों के लिए इसी तरह की समस्या को हल करने का लक्ष्य बना रहा है। विश्व स्वास्थ्य संगठन (WHO) की एक रिपोर्ट के अनुसार, दुनिया में 1.5 बिलियन लोग हैं जो किसी न किसी स्तर पर सुनने की अक्षमता से पीड़ित हैं। हालाँकि संगठन बोलने की अक्षमता के लिए ऐसा डेटा नहीं रखता है, लेकिन यह लाखों में होने की संभावना है। कई मामलों में, ये लोग संवाद करने के लिए लिखित संचार या सांकेतिक भाषा पर निर्भर होते हैं। जबकि पूर्व संचार को बहुत धीमा कर सकता है, बाद में सांकेतिक भाषा को बोले गए शब्दों में अनुवाद करने के लिए श्रोता के पास दुभाषिया होना चाहिए।

इस स्थिति के कारण अक्सर नौकरी पाने में मुश्किलें आती हैं, खासकर तब जब आपको ग्राहकों से बात करनी हो या आपको बहुत ज़्यादा संवाद करना हो। लेकिन यहीं पर ग्लोवेट्रिक्स जैसी कंपनियाँ काम आती हैं। भारतीय स्टार्टअप फिफ्थ सेंस नामक एक AI-संचालित डिवाइस पर काम कर रहा है जो लगभग वास्तविक समय में इशारों को सांकेतिक भाषा से भाषण में बदल सकता है और मौखिक विकलांगता से पीड़ित लोगों को प्रभावी ढंग से और बिना किसी सहायता के संवाद करने में मदद कर सकता है। गैजेट्स 360 में हमने स्टार्टअप के सह-संस्थापकों से उत्पाद और इसके पीछे की तकनीक के बारे में अधिक जानने के लिए बात की।

ग्लोवेट्रिक्स, एक भारतीय एआई स्टार्टअप

ग्लोवेट्रिक्स की स्थापना 2021 में सह-संस्थापक ऐश्वर्या कर्नाटकी और परीक्षित सोहोनी ने की थी, और दोनों ही कंपनी के संयुक्त सीईओ के रूप में काम करते हैं। कर्नाटकी की मुलाकात 2009 में एक श्रवण बाधित बच्चे से हुई, जिसने उन्हें सांकेतिक भाषा सीखने के लिए प्रेरित किया और उनकी बातचीत ने उन लोगों के लिए बदलाव लाने का बीज बोया जो इसी तरह की स्थिति से पीड़ित हैं। यह बीज फिफ्थ सेंस में तब पनपा जब उनकी मुलाकात दूसरे सह-संस्थापक सोहोनी से हुई, जो एक डेटा वैज्ञानिक हैं और जिन्हें पूर्वानुमान विश्लेषण में व्यापक अनुभव है, जिन्होंने अपने परिवार में इन संघर्षों का अनुभव किया और तुरंत इस कारण से जुड़ गए।

दोनों एक इंजीनियर के साथ मिलकर पुणे के बानेर में एक साझा कार्यालय में काम कर रहे हैं, ताकि तीन लोगों की टीम बनाई जा सके। अपने विज़न के बारे में बताते हुए, कर्नाटकी ने कहा, “हमारा विज़न सभी क्षमताओं वाले लोगों के बीच सहज संचार की सुविधा प्रदान करना और हर बधिर और वाणी बाधित व्यक्ति को अपनी प्राकृतिक भाषा – सांकेतिक भाषा में अभिव्यक्त करने और सुनने की क्षमता प्रदान करना है।”

ग्लोवेट्रिक्स पांचवीं इंद्रिय ग्लोवेट्रिक्स

फिफ्थ सेंस, एआई-संचालित दस्ताने
फोटो क्रेडिट: ग्लोवेट्रिक्स

फिफ्थ सेंस, बोलने में अक्षम लोगों के लिए एआई-संचालित दस्ताने

फॉर्म-फैक्टर के नजरिए से, AI-संचालित डिवाइस एक दस्ताने की तरह दिखता है जिसके ऊपर एक स्मार्टवॉच रखी गई है। सोहोनी ने हमें बताया कि AI दस्ताने हल्के कपड़े का उपयोग करके बनाए गए थे जिन्हें बिना किसी परेशानी के लगातार 6-8 घंटे तक पहना जा सकता है। दस्ताने के शीर्ष पर एक छेद है जहाँ उंगलियाँ बाहर निकल सकती हैं ताकि उपयोगकर्ता स्मार्टफोन या किसी अन्य कार्य का उपयोग कर सके जिसके लिए बेहतर पकड़ की आवश्यकता होती है। कपड़े में स्मार्टवॉच और किसी भी इशारे को पकड़ने के लिए कई सेंसर लगे हैं। कपड़ा खुद अलग किया जा सकता है और इसे अलग से भी धोया जा सकता है।

हार्डवेयर के बारे में बात करते हुए सोहोनी ने बताया कि कंपनी डिवाइस में इस्तेमाल होने वाले कंपोनेंट को अलग-अलग देशों से मंगवाती है और फिर कंपनी के इन-हाउस डिज़ाइन के आधार पर इसे अलग से बनाती है। यह भारत में काम करने वाली ज़्यादातर वियरेबल कंपनियों द्वारा अपनाया जाने वाला एक मानक मॉडल है।

लेकिन यह सॉफ्टवेयर ही है, जहां ग्लोवेट्रिक्स ने अपना नवाचार सामने लाया है। इस सिस्टम में दो भाग हैं जो सहज दो-तरफ़ा संचार को सक्षम करते हैं। पहला डिवाइस ही है जो AI द्वारा संचालित है, और दूसरा एक साथी ऐप है। सोहोनी ने कहा, “AI आर्किटेक्चर पूरी तरह से इन-हाउस विकसित किया गया था क्योंकि हमारे पास देखने के लिए कोई संदर्भ नहीं था।” दिलचस्प बात यह है कि ग्लोवेट्रिक्स जेनरेटिव AI का उपयोग नहीं करता है और इसके बजाय अपने जेस्चर-टू-स्पीच इंटरफ़ेस के लिए मशीन लर्निंग और विभिन्न प्रकार के विश्लेषण एल्गोरिदम का मिश्रण उपयोग करता है।

जब कोई इशारा किया जाता है, तो साथी ऐप उसे ऑडियो में बदल देता है और श्रोता के लिए उसे बजाता है। यह एक रिसीवर के रूप में भी काम करता है जब सुनने में अक्षम व्यक्ति को बिना सांकेतिक भाषा के वक्ता को सुनना पड़ता है। ऐप ध्वनि को सुनता है और फिर उपयोगकर्ता को पढ़ने के लिए उसे टेक्स्ट में बदल देता है। दिलचस्प बात यह है कि ऐप न केवल बोले गए शब्दों को बल्कि डोरबेल बजने जैसी अन्य आवाज़ों को भी पकड़ता है। कंपनी यह भी दावा करती है कि डिवाइस लगभग वास्तविक समय में काम करती है, जिससे धाराप्रवाह संचार संभव होता है।

ग्लोवेट्रिक्स गोपनीयता और कनेक्टिविटी चुनौतियों का समाधान कैसे कर रहा है

इन जैसे स्मार्ट डिवाइस के साथ देखी जाने वाली आम समस्याएं कनेक्टिविटी और गोपनीयता हैं। अधिकांश स्मार्ट डिवाइस, विशेष रूप से वे जो AI का उपयोग करते हैं, सर्वर पर कंप्यूट और प्रोसेस करते हैं। इसका मतलब है कि लैग-फ्री अनुभव के लिए तेज़ इंटरनेट का काम करना ज़रूरी है। इसी तरह, स्मार्ट डिवाइस को अपनी कार्यक्षमता प्रदान करने के लिए बहुत सारे उपयोगकर्ता डेटा एकत्र करने की आवश्यकता होती है। इस डेटा को सर्वर पर रखने से उल्लंघन के मामले में गोपनीयता संबंधी चिंताएँ भी पैदा हो सकती हैं।

ग्लोवेट्रिक्स ने दोनों समस्याओं का समाधान खोज लिया है। ऐप का पूरा रिसीवर हिस्सा डिवाइस पर ही किया जाता है, जिसका मतलब है कि टेक्स्ट में बदलने के लिए एकत्र किया गया कोई भी यूजर-साइड ऑडियो डिवाइस से बाहर नहीं जाता है। यह हिस्सा भी लैग-फ्री है क्योंकि इसके लिए सक्रिय इंटरनेट कनेक्टिविटी की आवश्यकता नहीं होती है। जेस्चर-टू-स्पीच पक्ष पर, सोहोनी ने कहा कि कनेक्टिविटी की समस्या को खत्म करने के लिए कुछ महत्वपूर्ण शब्द और अलग-अलग अक्षर भी ऐप में ही जोड़े जाएंगे। हालाँकि, चूँकि AI मॉडल के लिए शक्तिशाली कम्प्यूटेशनल प्रोसेसिंग की आवश्यकता होती है, इसलिए बाकी काम क्लाउड पर होगा जिसके लिए एक स्थिर इंटरनेट कनेक्शन की आवश्यकता होगी। विशेष रूप से, कंपनी का क्लाउड भी मूल रूप से बनाया गया है और भारतीय उपयोगकर्ताओं के लिए सर्वर-डिवाइस कनेक्टिविटी को अनुकूलित करने में मदद करनी चाहिए।

यहां ध्यान देने वाली बात यह है कि जहां एआई को भारतीय सांकेतिक भाषा में प्रशिक्षित किया गया है और यह हिंदी और मराठी में पाठ को परिवर्तित करता है, वहीं ऐप के भीतर एक पाठ अनुवाद उपकरण अंग्रेजी और अधिकांश भारतीय क्षेत्रीय भाषाओं में ऑडियो उत्पन्न करने में सक्षम होगा।

उत्पाद-बाज़ार का मेल ढूँढना

फिफ्थ सेंस फिलहाल एक प्रोटोटाइप है, और सोहोनी ने बताया कि कंपनी जल्द ही अपना पहला पायलट परीक्षण शुरू करेगी। स्टार्टअप को यह भी भरोसा है कि वह अगले छह महीनों के भीतर उत्पाद-बाजार के लिए उपयुक्त उत्पाद ढूँढ़ने में सक्षम हो जाएगा।

भले ही यह उत्पाद बाज़ार के लिए तैयार नहीं है, लेकिन ग्लोवेट्रिक्स ने पहले ही अपने डिवाइस के प्रभाव को देख लिया है। इसका दावा है कि एक वाणी-बाधित व्यक्ति अपने साक्षात्कारकर्ता से संवाद करने के लिए फिफ्थ सेंस का उपयोग करने के बाद नौकरी पाने में सक्षम हुआ।

और यह उत्पाद कितना महंगा हो सकता है? सोहोनी ने कहा कि एआई ग्लव्स के साथ विज़न कीमत को प्रतिस्पर्धी बनाए रखना है ताकि यह आम जनता तक पहुँच सके। हालाँकि उन्होंने किसी विशेष कीमत का खुलासा नहीं किया, लेकिन उन्होंने कहा कि इसकी कीमत मिड-रेंज स्मार्टफोन जितनी हो सकती है। इसके अलावा, कीमत को कम करने के लिए, ग्लोवेट्रिक्स सब्सक्रिप्शन-आधारित राजस्व मॉडल पर भी विचार कर रहा है जो अंतिम उपभोक्ता पर कीमत के बोझ को और कम कर सकता है।


संबद्ध लिंक स्वचालित रूप से उत्पन्न हो सकते हैं – विवरण के लिए हमारा नैतिकता वक्तव्य देखें।

Source link

Leave a Reply

Your email address will not be published. Required fields are marked *