Mistral Launches 8X22B Mixture of Experts AI Model in Open Source, Benchmarks Reveal Big Upgrades
मिस्ट्रल ने बुधवार को अपना नवीनतम आर्टिफिशियल इंटेलिजेंस (AI) मॉडल, 8X22B जारी किया। विशेषज्ञों का मिश्रण वाला AI मॉडल दिसंबर 2023 में जारी 8X7B मॉडल का अनुसरण करता है और एक बड़ा पैरामीटर आकार प्रदान करता है। अपने पूरी तरह से ओपन-सोर्स AI मॉडल के लिए जानी जाने वाली कंपनी ने नवीनतम मॉडल को अपरंपरागत तरीके से जारी किया, बिना किसी घोषणा पोस्ट या ब्लॉग पोस्ट के। जबकि AI फर्म द्वारा स्वयं कोई बेंचमार्क प्रदान नहीं किया गया है, हगिंग फेस समुदाय के उपयोगकर्ताओं ने इसका परीक्षण किया और 8X22B मॉडल के बेंचमार्क स्कोर पोस्ट किए। परिणाम OpenAI और Google के बंद मॉडल के साथ अंतर को कम करते प्रतीत होते हैं।
मिस्ट्रल का आधिकारिक एक्स (पूर्व में ट्विटर के नाम से जाना जाता था) अकाउंट जारी किया 8X22B AI मॉडल को टोरेंट मैग्नेट लिंक के माध्यम से जारी किया गया है, जो बिना किसी घोषणा के और सीधे लोगों को डाउनलोड करने के लिए AI मॉडल को छोड़ने की अपनी अपरंपरागत विधि को जारी रखता है। मिस्ट्रल एकमात्र सही मायने में ओपन-सोर्स प्लेटफ़ॉर्म में से एक है जो न केवल वज़न को खोलता है बल्कि संपूर्ण आर्किटेक्चर को भी खोलता है। हालाँकि, यह ध्यान दिया जाना चाहिए कि अधिकांश डिवाइस शक्तिशाली AI मॉडल को डिवाइस पर चलाने के लिए सुसज्जित नहीं हैं, और इससे डिवाइस में खराबी आ सकती है। कुल फ़ाइल का आकार 262GB है।
मिस्ट्रल का 8X22B एक ऑटोकम्प्लीट AI मॉडल है। ये आम तौर पर AI मॉडल के निर्देश या चैट वेरिएंट से अलग होते हैं। OpenAI का ChatGPT और Google का Gemini AI चैट मॉडल हैं, जबकि मेटा का Code Llama 7B और 13B निर्देश मॉडल हैं। चैट मॉडल वे होते हैं जो सही प्रतिक्रिया देने के लिए प्राकृतिक भाषा और प्रासंगिक प्रश्नों को समझ सकते हैं। निर्देश मॉडल मुख्य रूप से डेवलपर्स द्वारा उपयोग किए जाते हैं जो AI मॉडल को एक विशिष्ट कार्य करने के लिए कहते हैं। इसके विपरीत, एक ऑटोकम्प्लीट मॉडल प्रॉम्प्ट में दिए गए वाक्य को पूरा करता है।
हगिंग फेस कम्युनिटी पोस्ट पर आधारित शुरुआती बेंचमार्क स्कोर से पता चलता है कि नवीनतम मिस्ट्रल मॉडल अपने पूर्ववर्तियों की तुलना में महत्वपूर्ण अपग्रेड प्रदान करता है और अन्य प्रमुख मॉडलों के साथ अंतर को कम करता है। हेलसवाग बेंचमार्क में, मिस्ट्रल 8X22B ने 88.9 स्कोर किया, जो GPT-4 के 95.3, क्लाउड 3 ओपस के 95.4 और जेमिनी 1.5 प्रो के 92.5 से थोड़ा पीछे है। हालाँकि, यह GPT-3.5 के 85.5 और जेमिनी 1.0 अल्ट्रा के 87.8 से आगे निकल गया।
मिस्ट्रल के अपने मॉडलों के साथ बेंचमार्क की तुलना करें तो 8X22B मिस्ट्रल-मीडियम और मिस्ट्रल-लार्ज मॉडल के बीच आता है। बाद में इंस्ट्रक्ट या चैट वैरिएंट के रिलीज़ होने पर, यह मिस्ट्रल-लार्ज के समान ही प्रदर्शन कर सकता है।
नवीनतम तकनीकी समाचारों और समीक्षाओं के लिए, गैजेट्स 360 को फ़ॉलो करें एक्सFacebook, WhatsApp, थ्रेड्स और Google News. गैजेट्स और तकनीक पर नवीनतम वीडियो के लिए, हमारे YouTube चैनल को सब्सक्राइब करें। यदि आप शीर्ष प्रभावशाली लोगों के बारे में सब कुछ जानना चाहते हैं, तो Instagram और YouTube पर हमारे इन-हाउस Who’sThat360 को फ़ॉलो करें।
एप्पल ने 92 देशों में iPhone उपयोगकर्ताओं को ‘भाड़े के स्पाइवेयर’ हमले की चेतावनी दी
मोटोरोला एज 50 अल्ट्रा गीकबेंच पर दिखाई दिया, स्नैपड्रैगन 8s जेन 3 SoC पर चल सकता है