Gemma 2 2B AI Model Released by Google DeepMind, Said to Outperform GPT 3.5 Models in Benchmark
Google DeepMind ने गुरुवार को Gemma 2 2B आर्टिफिशियल इंटेलिजेंस (AI) मॉडल जारी किया। यह Gemma 2 AI मॉडल के परिवार का नवीनतम जोड़ बन गया है और Gemma 2 27B और 9B मॉडल में शामिल हो गया है। हल्के आकार के बावजूद, कंपनी का दावा है कि इसने LMSYS चैटबॉट एरिना बेंचमार्क पर GPT-3.5 मॉडल से बेहतर प्रदर्शन किया। इसके साथ ही, टेक दिग्गज ने Gemma 2 के इनपुट और आउटपुट को फ़िल्टर करने के लिए क्लासिफायर मॉडल का एक सूट ShieldGemma और Gemma Scope भी जारी किया, जो एक शोध उपकरण है जो AI मॉडल के काम करने के तरीके के बारे में जानकारी देता है।
जेम्मा 2 2B AI मॉडल की विशेषताएं
Google for Developers पर एक ब्लॉग पोस्ट में, कंपनी ने Gemma 2 2B की घोषणा की, जो परिवार का सबसे छोटा भाषा मॉडल बन गया है। ऑन-डिवाइस AI मॉडल के रूप में पेश किए गए, पोस्ट ने इस बात पर प्रकाश डाला कि इसके छोटे पैरामीटर आकार के बावजूद, आउटपुट इसके वेट क्लास से काफी अधिक है क्योंकि इसे बड़े मॉडलों से निकाला गया था। हालाँकि, टेक दिग्गज ने यह नहीं बताया कि इसके प्रशिक्षण के लिए कौन से AI मॉडल का इस्तेमाल किया गया था।
गूगल ने यह भी दावा किया कि गेम्मा 2 2बी एआई मॉडल ने बड़े मॉडल सिस्टम ऑर्गनाइजेशन (एलएमवाईएस) चैटबॉट एरिना एलो स्कोर पर जीपीटी-3.5 मॉडल से बेहतर प्रदर्शन किया। एआई मॉडल को 1126 का स्कोर मिला है, जबकि मिक्सट्रल 8×7बी इंस्ट्रक्ट v0.1 मॉडल ने 1114 और जीपीटी-3.5 ने 1106 स्कोर किया है।
AI मॉडल को हार्डवेयर की एक विस्तृत श्रृंखला पर चलाने के लिए भी अनुकूलित किया गया है। एज डिवाइस और क्लाउड-आधारित परिनियोजन के लिए, इसे वर्टेक्स AI और Google Kubernetes Engine (GKE) के लिए ठीक से ट्यून किया गया है। इसे Nvidia TensorRT-LLM लाइब्रेरी के लिए भी अनुकूलित किया गया है और इसे Nvidia NIM के रूप में उपलब्ध कराया गया है। इसके अलावा, Gemma 2 2B Keras, JAX, Hugging Face और अन्य प्रमुख प्लेटफ़ॉर्म के साथ भी एकीकृत होता है।
चूंकि यह एक ओपन-सोर्स AI मॉडल है, इसलिए ओपन वेट को Google की हगिंग फेस लिस्टिंग, कागल या वर्टेक्स AI मॉडल गार्डन से डाउनलोड किया जा सकता है। इसे Google AI स्टूडियो पर भी आज़माया जा सकता है।
गेम्मा 2 के अलावा, शील्ड गेम्मा, सुरक्षा क्लासिफायर का एक सूट भी जारी किया गया जो एआई मॉडल के इनपुट और आउटपुट दोनों में हानिकारक सामग्री का पता लगा सकता है और उसे हटा सकता है। गूगल ने कहा कि यह सिस्टम अभद्र भाषा, उत्पीड़न, यौन रूप से स्पष्ट सामग्री और खतरनाक सामग्री पर ध्यान केंद्रित करेगा।
अंत में, शिक्षाविदों और डेवलपर्स के लिए एक शोध उपकरण, जेम्मा स्कोप भी जारी किया गया। यह प्रणाली मॉडल के भीतर विशिष्ट भागों को इंगित करने के लिए विरल ऑटोएनकोडर (SAE) का उपयोग करती है ताकि यह उजागर किया जा सके कि निर्णय लेने की प्रक्रिया कैसे काम करती है और आर्किटेक्चर कैसे संचालित होता है।