September 19, 2024
A.I

Mistral Launches 8X22B Mixture of Experts AI Model in Open Source, Benchmarks Reveal Big Upgrades

  • August 18, 2024
  • 1 min read
Mistral Launches 8X22B Mixture of Experts AI Model in Open Source, Benchmarks Reveal Big Upgrades

मिस्ट्रल ने बुधवार को अपना नवीनतम आर्टिफिशियल इंटेलिजेंस (AI) मॉडल, 8X22B जारी किया। विशेषज्ञों का मिश्रण वाला AI मॉडल दिसंबर 2023 में जारी 8X7B मॉडल का अनुसरण करता है और एक बड़ा पैरामीटर आकार प्रदान करता है। अपने पूरी तरह से ओपन-सोर्स AI मॉडल के लिए जानी जाने वाली कंपनी ने नवीनतम मॉडल को अपरंपरागत तरीके से जारी किया, बिना किसी घोषणा पोस्ट या ब्लॉग पोस्ट के। जबकि AI फर्म द्वारा स्वयं कोई बेंचमार्क प्रदान नहीं किया गया है, हगिंग फेस समुदाय के उपयोगकर्ताओं ने इसका परीक्षण किया और 8X22B मॉडल के बेंचमार्क स्कोर पोस्ट किए। परिणाम OpenAI और Google के बंद मॉडल के साथ अंतर को कम करते प्रतीत होते हैं।

मिस्ट्रल का आधिकारिक एक्स (पूर्व में ट्विटर के नाम से जाना जाता था) अकाउंट जारी किया 8X22B AI मॉडल को टोरेंट मैग्नेट लिंक के माध्यम से जारी किया गया है, जो बिना किसी घोषणा के और सीधे लोगों को डाउनलोड करने के लिए AI मॉडल को छोड़ने की अपनी अपरंपरागत विधि को जारी रखता है। मिस्ट्रल एकमात्र सही मायने में ओपन-सोर्स प्लेटफ़ॉर्म में से एक है जो न केवल वज़न को खोलता है बल्कि संपूर्ण आर्किटेक्चर को भी खोलता है। हालाँकि, यह ध्यान दिया जाना चाहिए कि अधिकांश डिवाइस शक्तिशाली AI मॉडल को डिवाइस पर चलाने के लिए सुसज्जित नहीं हैं, और इससे डिवाइस में खराबी आ सकती है। कुल फ़ाइल का आकार 262GB है।

मिस्ट्रल का 8X22B एक ऑटोकम्प्लीट AI मॉडल है। ये आम तौर पर AI मॉडल के निर्देश या चैट वेरिएंट से अलग होते हैं। OpenAI का ChatGPT और Google का Gemini AI चैट मॉडल हैं, जबकि मेटा का Code Llama 7B और 13B निर्देश मॉडल हैं। चैट मॉडल वे होते हैं जो सही प्रतिक्रिया देने के लिए प्राकृतिक भाषा और प्रासंगिक प्रश्नों को समझ सकते हैं। निर्देश मॉडल मुख्य रूप से डेवलपर्स द्वारा उपयोग किए जाते हैं जो AI मॉडल को एक विशिष्ट कार्य करने के लिए कहते हैं। इसके विपरीत, एक ऑटोकम्प्लीट मॉडल प्रॉम्प्ट में दिए गए वाक्य को पूरा करता है।

हगिंग फेस कम्युनिटी पोस्ट पर आधारित शुरुआती बेंचमार्क स्कोर से पता चलता है कि नवीनतम मिस्ट्रल मॉडल अपने पूर्ववर्तियों की तुलना में महत्वपूर्ण अपग्रेड प्रदान करता है और अन्य प्रमुख मॉडलों के साथ अंतर को कम करता है। हेलसवाग बेंचमार्क में, मिस्ट्रल 8X22B ने 88.9 स्कोर किया, जो GPT-4 के 95.3, क्लाउड 3 ओपस के 95.4 और जेमिनी 1.5 प्रो के 92.5 से थोड़ा पीछे है। हालाँकि, यह GPT-3.5 के 85.5 और जेमिनी 1.0 अल्ट्रा के 87.8 से आगे निकल गया।

मिस्ट्रल के अपने मॉडलों के साथ बेंचमार्क की तुलना करें तो 8X22B मिस्ट्रल-मीडियम और मिस्ट्रल-लार्ज मॉडल के बीच आता है। बाद में इंस्ट्रक्ट या चैट वैरिएंट के रिलीज़ होने पर, यह मिस्ट्रल-लार्ज के समान ही प्रदर्शन कर सकता है।


संबद्ध लिंक स्वचालित रूप से उत्पन्न हो सकते हैं – विवरण के लिए हमारा नैतिकता वक्तव्य देखें।

नवीनतम तकनीकी समाचारों और समीक्षाओं के लिए, गैजेट्स 360 को फ़ॉलो करें एक्सFacebook, WhatsApp, थ्रेड्स और Google News. गैजेट्स और तकनीक पर नवीनतम वीडियो के लिए, हमारे YouTube चैनल को सब्सक्राइब करें। यदि आप शीर्ष प्रभावशाली लोगों के बारे में सब कुछ जानना चाहते हैं, तो Instagram और YouTube पर हमारे इन-हाउस Who’sThat360 को फ़ॉलो करें।

एप्पल ने 92 देशों में iPhone उपयोगकर्ताओं को ‘भाड़े के स्पाइवेयर’ हमले की चेतावनी दी


मोटोरोला एज 50 अल्ट्रा गीकबेंच पर दिखाई दिया, स्नैपड्रैगन 8s जेन 3 SoC पर चल सकता है



Source link

Leave a Reply

Your email address will not be published. Required fields are marked *

Solverwp- WordPress Theme and Plugin