Mistral Large 2 Open Source AI Model Released, Said to Be on Par With Meta Llama 3.1 405B
मिस्ट्रल ने बुधवार को अपने प्रमुख ओपन-सोर्स आर्टिफिशियल इंटेलिजेंस (AI) मॉडल, मिस्ट्रल लार्ज 2 की नई पीढ़ी जारी की। कंपनी का दावा है कि AI मॉडल कोड जनरेशन, गणित और तर्क में काफी बेहतर क्षमताएं प्रदान करता है। इसमें कई नई भाषाओं के साथ-साथ उन्नत फ़ंक्शन कॉलिंग क्षमताओं का समर्थन भी मिलता है। यह भी कहा जाता है कि हाल ही में जारी मेटा लामा 3.1 405B AI मॉडल के एक-तिहाई आकार के बावजूद, मिस्ट्रल का प्रमुख बड़ा भाषा मॉडल (LLM) समान प्रदर्शन प्रदान करता है। विशेष रूप से, मिस्ट्रल लार्ज 2 केवल शोध और गैर-व्यावसायिक उपयोगों के लिए उपलब्ध है।
मिस्ट्रल लार्ज 2 की विशेषताएं
कंपनी ने न्यूज़रूम पोस्ट में AI मॉडल की घोषणा की। मिस्ट्रल लार्ज 2 1,28,000 टोकन कॉन्टेक्स्ट विंडो के साथ आता है, जो मेटा की नवीनतम AI पेशकश के समान है। इसके अतिरिक्त, फ्लैगशिप मिस्ट्रल AI मॉडल अरबी, चीनी, फ्रेंच, जर्मन, हिंदी, इतालवी, जापानी, कोरियाई, पुर्तगाली, रूसी और स्पेनिश सहित कई नई भाषाओं का समर्थन करता है। साथ ही, यह 80 से अधिक कोडिंग भाषाओं में कोड भी उत्पन्न कर सकता है।
मिस्ट्रल के नए AI मॉडल का आकार 123 बिलियन पैरामीटर है, और यह एक ही नोड पर चल सकता है। कंपनी ने कहा कि लार्ज 2 मॉडल को बेहतर बनाने के लिए तीन मुख्य फोकस क्षेत्र थे। पहला कोड जनरेशन था और LLM को बड़ी मात्रा में कोडिंग डेटा पर प्रशिक्षित किया गया था। दूसरा, अपनी तर्क क्षमता को बेहतर बनाने और भ्रम की घटनाओं को कम करने के लिए, AI फर्म ने प्रतिक्रियाओं में अधिक सतर्क रहने के लिए मॉडल को ठीक किया। अंत में, AI मॉडल को “यह स्वीकार करने के लिए प्रशिक्षित किया गया कि जब वह समाधान नहीं खोज सकता है या उसके पास एक आश्वस्त उत्तर देने के लिए पर्याप्त जानकारी नहीं है।”
लामा 3.1 405B के आकार का एक तिहाई होने के बावजूद, कंपनी का दावा है कि इसका LLM इससे बेहतर प्रदर्शन करता है। अपने आंतरिक बेंचमार्क परीक्षण के आधार पर, मिस्ट्रल ने कहा कि इसका AI मॉडल कोड जनरेशन और गणित प्रदर्शन में बेहतर प्रदर्शन करता है। इसने जावा कोड जनरेशन में GPT-4o से बेहतर प्रदर्शन करने का भी दावा किया।
इसके अलावा, कंपनी का दावा है कि मिस्ट्रल लार्ज 2 में फ़ंक्शन कॉलिंग और पुनर्प्राप्ति कौशल को बढ़ाया गया है जो इसे जटिल व्यावसायिक अनुप्रयोगों को शक्ति प्रदान करने की अनुमति देता है। फ़ंक्शन कॉलिंग बाहरी उपकरणों या फ़ंक्शन के साथ बातचीत करने के लिए AI मॉडल की क्षमता है। यह उन्हें विभिन्न स्रोतों से डेटा प्राप्त करने और अधिक सटीक, सूचनात्मक और कुशल प्रतिक्रियाएँ प्रदान करने की अनुमति देता है।
कंपनी ने मैनेज्ड एप्लिकेशन प्रोग्रामिंग इंटरफ़ेस (API) के ज़रिए वर्टेक्स AI में लार्ज 2 AI मॉडल लाने के लिए Google क्लाउड प्लेटफ़ॉर्म के साथ साझेदारी की है। यह Azure AI स्टूडियो, Amazon Bedrock और IBM Watsonx के ज़रिए क्लाउड पर भी उपलब्ध है। चूँकि यह एक ओपन सोर्स AI मॉडल है, इसलिए इच्छुक व्यक्ति Mistral-large-2407 नाम से इसकी वेबसाइट के ज़रिए LLM तक पहुँच सकते हैं।
इंस्ट्रक्ट मॉडल को डाउनलोड करने के लिए, उपयोगकर्ता इसकी हगिंगफेस लिस्टिंग देख सकते हैं। उल्लेखनीय रूप से, यह मिस्ट्रल रिसर्च लाइसेंस के तहत उपलब्ध है जो केवल अनुसंधान और गैर-वाणिज्यिक उपयोगों के लिए उपयोग और संशोधन की अनुमति देता है।