Google DeepMind’s SIMA Is an AI Agent That Can Play 3D Video Games
गूगल डीपमाइंड ने बुधवार को एक अनोखा आर्टिफिशियल इंटेलिजेंस (AI) मॉडल पेश किया जो 3D वीडियो गेम को ठीक वैसे ही खेल सकता है जैसे कोई इंसान खेलता है। इस AI मॉडल को स्केलेबल इंस्ट्रक्टेबल मल्टीवर्ल्ड एजेंट या SIMA कहा जाता है, और यह सीख रहा है कि विभिन्न गेमिंग वातावरणों के साथ कैसे बातचीत की जाए और विभिन्न कार्यों को कैसे अंजाम दिया जाए। मॉडल पर अभी शोध चल रहा है और अधिक जटिल हरकतें करने में विशेषज्ञता हासिल करने के लिए अभी भी इसे प्रशिक्षित किया जा रहा है। गूगल का कहना है कि एक बार पूर्ण हो जाने के बाद, AI मॉडल का ऑनलाइन और वास्तविक दुनिया दोनों में व्यापक उपयोग हो सकता है।
एक ब्लॉग पोस्ट में, डीपमाइंड की सिमा टीम ने बताया कि एआई मॉडल को सुपर-इंटेलिजेंट गेमर बनाने के लिए विकसित नहीं किया जा रहा है जो किसी भी गेम को हरा सकता है। इसके बजाय, इसका उद्देश्य इसे ओपन-वर्ल्ड स्थितियों में 3डी गेम में घूमना सिखाना है और यह समझना है कि कोई इंसान प्राकृतिक-भाषा निर्देशों का उपयोग करके कैसे प्रतिक्रिया देगा और उसके साथ बातचीत करेगा। Google ने इस बात पर प्रकाश डाला कि यह एक बहुत ही कठिन कार्य है और इस पर ध्यान केंद्रित किया जाना चाहिए।
सिमा टीम ने कहा, “यह सामान्य रूप से एआई के लिए एक महत्वपूर्ण लक्ष्य है, क्योंकि बड़े भाषा मॉडल ने शक्तिशाली प्रणालियों को जन्म दिया है जो दुनिया के बारे में ज्ञान प्राप्त कर सकते हैं और योजनाएं बना सकते हैं, लेकिन वर्तमान में उनमें हमारी ओर से कार्रवाई करने की क्षमता का अभाव है।”
AI मॉडल के लिए सीखने का माहौल बनाने के लिए, Google DeepMind ने आठ गेम स्टूडियो के साथ भागीदारी की और SIMA को नौ अलग-अलग वीडियो गेम पर प्रशिक्षित किया। उनमें से कुछ में Hello Games का No Man’s Sky, Tuxedo Labs का Teardown, Coffee Stain Studios का Goat Simulator 3 और Valheim आदि शामिल हैं। AI मॉडल को प्रत्येक गेम में नई इंटरैक्टिव दुनिया से अवगत कराया गया और उसे दुनिया में नेविगेट करना, वस्तुओं के साथ बातचीत करना, मेनू का उपयोग करना और बहुत कुछ सीखना था।
कंपनी ने चार शोध वातावरण भी बनाए, जिसमें यूनिटी के साथ बनाया गया एक नया वातावरण भी शामिल है जिसे कंस्ट्रक्शन लैब कहा जाता है। इस विशेष वातावरण में, AI मॉडल को बिल्डिंग ब्लॉक्स से मूर्तियां बनाने का काम सौंपा गया था ताकि इसकी वस्तु हेरफेर और भौतिक दुनिया की सहज समझ का परीक्षण किया जा सके।
गूगल ने बताया कि सिमा के मौजूदा संस्करण का मूल्यांकन 600 बुनियादी कौशलों के आधार पर किया गया था, जिसमें नेविगेशन जैसे कि बाएं मुड़ना और कार चलाना, ऑब्जेक्ट इंटरैक्शन जैसे कि सीढ़ी चढ़ना और हेलमेट बनाना आदि शामिल हैं। कार्य काफी हद तक सरल थे और 10 सेकंड के भीतर पूरे किए जा सकते थे।
कंपनी के अनुसार, 3D वीडियो गेम के विविध सेट पर AI मॉडल को प्रशिक्षित करना, जहाँ यह मानव निर्देशों का पालन करता है और उसके अनुसार कार्य करता है, भविष्य में एक बड़ा प्रभाव डाल सकता है। कंपनी अब SIMA को अधिक जटिल निर्देशों के साथ प्रशिक्षित करने पर ध्यान केंद्रित कर रही है “जिसके लिए उच्च-स्तरीय रणनीतिक योजना और कई उप-कार्यों को पूरा करने की आवश्यकता होती है, जैसे कि संसाधन ढूंढना और शिविर बनाना।” Google संकेत देता है कि ये कार्य वास्तविक दुनिया में अनुवाद किए जा सकते हैं और कंपनी ऐसे तरीके खोजने पर काम कर रही है जिससे यह मनुष्यों के लिए मददगार हो सके।