MIT Unveils Novel Method of Training General-Purpose Robots Using Generative AI Techniques
मैसाचुसेट्स इंस्टीट्यूट ऑफ टेक्नोलॉजी (एमआईटी) ने पिछले हफ्ते रोबोट को प्रशिक्षित करने के लिए एक नई विधि का अनावरण किया जो जेनरेटिव आर्टिफिशियल इंटेलिजेंस (एआई) मॉडल का उपयोग करता है। नई तकनीक विभिन्न डोमेन और तौर-तरीकों में डेटा के संयोजन और उन्हें एक साझा भाषा में एकीकृत करने पर निर्भर करती है जिसे बाद में बड़े भाषा मॉडल (एलएलएम) द्वारा संसाधित किया जा सकता है। एमआईटी शोधकर्ताओं का दावा है कि यह विधि सामान्य प्रयोजन वाले रोबोटों को जन्म दे सकती है जो प्रत्येक कौशल को व्यक्तिगत रूप से प्रशिक्षित करने की आवश्यकता के बिना कार्यों की एक विस्तृत श्रृंखला को संभाल सकते हैं।
एमआईटी शोधकर्ताओं ने रोबोटों को प्रशिक्षित करने के लिए एआई-प्रेरित तकनीक विकसित की
एक न्यूज़रूम पोस्ट में, एमआईटी ने रोबोटों को प्रशिक्षित करने की नई पद्धति के बारे में विस्तार से बताया। वर्तमान में, रोबोट को एक निश्चित कार्य सिखाना एक कठिन प्रस्ताव है क्योंकि बड़ी मात्रा में सिमुलेशन और वास्तविक दुनिया के डेटा की आवश्यकता होती है। यह आवश्यक है क्योंकि यदि रोबोट यह नहीं समझ पाता कि किसी दिए गए वातावरण में कार्य कैसे करना है, तो उसे इसके अनुकूल ढलने में कठिनाई होगी।
इसका मतलब है कि प्रत्येक नए कार्य के लिए, प्रत्येक सिमुलेशन और वास्तविक दुनिया के परिदृश्य वाले डेटा के नए सेट की आवश्यकता होती है। इसके बाद रोबोट एक प्रशिक्षण अवधि से गुजरता है जहां क्रियाओं को अनुकूलित किया जाता है और त्रुटियों और गड़बड़ियों को दूर किया जाता है। परिणामस्वरूप, रोबोटों को आम तौर पर एक विशिष्ट कार्य पर प्रशिक्षित किया जाता है, और विज्ञान कथा फिल्मों में देखे जाने वाले बहुउद्देश्यीय रोबोट वास्तविकता में नहीं देखे गए हैं।
हालाँकि, MIT के शोधकर्ताओं द्वारा विकसित एक नई तकनीक इस चुनौती को दूर करने का दावा करती है। प्री-प्रिंट ऑनलाइन जर्नल arXIv (नोट: यह सहकर्मी-समीक्षा नहीं है) में प्रकाशित एक पेपर में, वैज्ञानिकों ने इस बात पर प्रकाश डाला कि जेनरेटिव एआई इस समस्या से निपटने में सहायता कर सकता है।
इसके लिए, विभिन्न डोमेन में डेटा, जैसे सिमुलेशन और वास्तविक रोबोट, और विज़न सेंसर और रोबोटिक आर्म पोजीशन एनकोडर जैसे विभिन्न तौर-तरीकों को एक साझा भाषा में एकीकृत किया गया था जिसे एआई मॉडल द्वारा संसाधित किया जा सकता है। डेटा को एकीकृत करने के लिए हेटेरोजेनस प्रीट्रेन्ड ट्रांसफॉर्मर्स (एचपीटी) नामक एक नया आर्किटेक्चर भी विकसित किया गया था।
दिलचस्प बात यह है कि अध्ययन के मुख्य लेखक, इलेक्ट्रिकल इंजीनियरिंग और कंप्यूटर साइंस (ईईसीएस) के स्नातक छात्र लिरुई वांग ने कहा कि इस तकनीक की प्रेरणा ओपनएआई के जीपीटी-4 जैसे एआई मॉडल से ली गई थी।
शोधकर्ताओं ने अपने सिस्टम के बीच में एक ट्रांसफॉर्मर (जीपीटी आर्किटेक्चर के समान) नामक एक एलएलएम मॉडल जोड़ा है और यह दृष्टि और प्रोप्रियोसेप्शन (स्वयं-आंदोलन, बल और स्थिति की भावना) इनपुट दोनों को संसाधित करता है।
एमआईटी शोधकर्ताओं का कहना है कि पारंपरिक तरीकों की तुलना में रोबोट को प्रशिक्षित करने के लिए यह नई विधि तेज़ और कम महंगी हो सकती है। यह मुख्यतः विभिन्न कार्यों में रोबोट को प्रशिक्षित करने के लिए आवश्यक कार्य-विशिष्ट डेटा की कम मात्रा के कारण है। इसके अलावा, अध्ययन में पाया गया कि इस पद्धति ने सिमुलेशन और वास्तविक दुनिया के प्रयोगों दोनों में 20 प्रतिशत से अधिक प्रशिक्षण से बेहतर प्रदर्शन किया।