A.I

Mistral Large 2 Open Source AI Model Released, Said to Be on Par With Meta Llama 3.1 405B

मिस्ट्रल ने बुधवार को अपने प्रमुख ओपन-सोर्स आर्टिफिशियल इंटेलिजेंस (एआई) मॉडल, मिस्ट्रल लार्ज 2 की नई पीढ़ी जारी की। कंपनी का दावा है कि एआई मॉडल कोड जेनरेशन, गणित और तर्क में काफी बेहतर क्षमताएं प्रदान करता है। इसमें कई नई भाषाओं के साथ-साथ उन्नत फ़ंक्शन कॉलिंग क्षमताओं का भी समर्थन मिलता है। यह भी कहा जाता है कि हाल ही में जारी मेटा लामा 3.1 405बी एआई मॉडल का आकार एक तिहाई होने के बावजूद, मिस्ट्रल का प्रमुख बड़ा भाषा मॉडल (एलएलएम) समान प्रदर्शन प्रदान करता है। विशेष रूप से, मिस्ट्रल लार्ज 2 केवल अनुसंधान और गैर-व्यावसायिक उपयोग के लिए उपलब्ध है।

मिस्ट्रल लार्ज 2 विशेषताएं

कंपनी ने एक न्यूज़रूम पोस्ट में AI मॉडल की घोषणा की। मिस्ट्रल लार्ज 2 1,28,000 टोकन संदर्भ विंडो के साथ आता है, जो मेटा की नवीनतम एआई पेशकश के समान है। इसके अतिरिक्त, प्रमुख मिस्ट्रल एआई मॉडल अरबी, चीनी, फ्रेंच, जर्मन, हिंदी, इतालवी, जापानी, कोरियाई, पुर्तगाली, रूसी और स्पेनिश सहित कई नई भाषाओं का समर्थन करता है। साथ ही, यह 80 से अधिक कोडिंग भाषाओं में कोड भी जेनरेट कर सकता है।

मिस्ट्रल के नए एआई मॉडल का आकार 123 बिलियन पैरामीटर है, और यह एक नोड पर चल सकता है। कंपनी ने कहा कि लार्ज 2 मॉडल को बेहतर बनाने के लिए तीन मुख्य फोकस क्षेत्र थे। सबसे पहले कोड जनरेशन था और एलएलएम को बड़ी मात्रा में कोडिंग डेटा पर प्रशिक्षित किया गया था। दूसरा, अपनी तर्क क्षमता में सुधार करने और मतिभ्रम की घटनाओं को कम करने के लिए, एआई फर्म ने प्रतिक्रियाओं में अधिक सतर्क रहने के लिए मॉडल को बेहतर बनाया। अंत में, एआई मॉडल को “यह स्वीकार करने के लिए प्रशिक्षित किया गया कि जब वह समाधान नहीं ढूंढ पाता है या उसके पास विश्वसनीय उत्तर देने के लिए पर्याप्त जानकारी नहीं है।”

लामा 3.1 405बी का आकार एक तिहाई होने के बावजूद, कंपनी का दावा है कि उसका एलएलएम उससे बेहतर प्रदर्शन करता है। अपने आंतरिक बेंचमार्क परीक्षण के आधार पर, मिस्ट्रल ने कहा कि उसके एआई मॉडल ने कोड जेनरेशन और गणित प्रदर्शन में बेहतर प्रदर्शन किया है। इसने जावा कोड जनरेशन में GPT-4o से बेहतर प्रदर्शन करने का भी दावा किया।

इसके अलावा, कंपनी का दावा है कि मिस्ट्रल लार्ज 2 में फ़ंक्शन कॉलिंग और पुनर्प्राप्ति कौशल को बढ़ाया गया है जो इसे जटिल व्यावसायिक अनुप्रयोगों को शक्ति प्रदान करने की अनुमति देता है। फ़ंक्शन कॉलिंग एआई मॉडल की बाहरी टूल या फ़ंक्शंस के साथ बातचीत करने की क्षमता है। यह उन्हें विभिन्न स्रोतों से डेटा प्राप्त करने और अधिक सटीक, सूचनात्मक और कुशल प्रतिक्रियाएँ प्रदान करने की अनुमति देता है।

कंपनी ने प्रबंधित एप्लिकेशन प्रोग्रामिंग इंटरफ़ेस (एपीआई) के माध्यम से बड़े 2 एआई मॉडल को वर्टेक्स एआई में लाने के लिए Google क्लाउड प्लेटफ़ॉर्म के साथ साझेदारी की है। यह एज़्योर एआई स्टूडियो, अमेज़ॅन बेडरॉक और आईबीएम वॉटसनएक्स के माध्यम से क्लाउड पर भी उपलब्ध है। चूंकि यह एक ओपन सोर्स एआई मॉडल है, इच्छुक व्यक्ति मिस्ट्रल-लार्ज-2407 नाम के तहत इसकी वेबसाइट के माध्यम से एलएलएम तक भी पहुंच सकते हैं।

इंस्ट्रक्शन मॉडल डाउनलोड करने के लिए, उपयोगकर्ता इसकी हगिंगफेस लिस्टिंग की जांच कर सकते हैं। विशेष रूप से, यह मिस्ट्रल रिसर्च लाइसेंस के तहत उपलब्ध है जो केवल अनुसंधान और गैर-व्यावसायिक उपयोग के लिए उपयोग और संशोधन की अनुमति देता है।

Source link

Related Articles

Leave a Reply

Your email address will not be published. Required fields are marked *

Back to top button