Microsoft Phi-3 Launched as Company’s Smallest Open-Source AI Model to Date
माइक्रोसॉफ्ट ने मंगलवार को अपना अब तक का सबसे छोटा लैंग्वेज आर्टिफिशियल इंटेलिजेंस (AI) मॉडल Phi-3 जारी किया। छोटे AI मॉडल महत्वपूर्ण हैं, क्योंकि उनमें स्मार्टफ़ोन पर चलने की क्षमता है। नवीनतम AI मॉडल Phi-2 का उत्तराधिकारी है, जिसे दिसंबर 2023 में जारी किया गया था, और यह उच्च प्रशिक्षण डेटाबेस और बड़े मापदंडों के साथ आता है। बढ़े हुए पैरामीटर AI मॉडल को अपने पूर्ववर्ती की तुलना में अधिक जटिल प्रश्नों को समझने और उनका जवाब देने में मदद करते हैं। यह भी दावा किया जाता है कि यह Phi-3 के लिए उपयोग किए जाने वाले मापदंडों की संख्या से 10 गुना से अधिक पर प्रशिक्षित मॉडल के बराबर है।
छोटे भाषा मॉडल (SLM) का विवरण देने वाला एक प्री-प्रिंट पेपर arXiv पर प्रकाशित किया गया है। हालाँकि, चूँकि arXiv सहकर्मी समीक्षा नहीं करता है, इसलिए दावों की वैधता का पता लगाना अभी बाकी है। AI के प्रति उत्साही Azure और Ollama के माध्यम से AI मॉडल का परीक्षण कर सकते हैं। Microsoft ने कहा कि AI मॉडल Nvidia NIM माइक्रोसर्विस पर एक मानक API इंटरफ़ेस के साथ भी उपलब्ध है, और इसे Nvidia GPU के लिए अनुकूलित किया गया है। Phi-3-mini के लिए एक हगिंग फेस कैटलॉग भी बनाया गया है, लेकिन वज़न अभी जारी नहीं किया गया है।
phi-3 यहाँ है, और यह … अच्छा है :-).
मैंने आपको यह अनुभव देने के लिए एक छोटा सा डेमो बनाया है कि फाई-3-मिनी (3.8बी) क्या कर सकता है। कल सुबह ओपन वेट रिलीज़ और अन्य घोषणाओं के लिए बने रहें!
(और निश्चित रूप से यह बेंचमार्क की सामान्य तालिका के बिना पूरा नहीं होगा!) pic.twitter.com/AWA7Km59rp
— सेबेस्टियन बुबेक (@SebastienBubeck) 23 अप्रैल, 2024
प्रदर्शन के मामले में, AI मॉडल को 3.3 ट्रिलियन टोकन पर प्रशिक्षित किया गया है – डेटा की इकाइयाँ जिनमें शब्द, वाक्यांश या शब्दों के उपखंड शामिल हैं जिन्हें AI मॉडल को प्रशिक्षित करने के लिए सिस्टम में फीड किया जाता है। इसमें 3.8 बिलियन पैरामीटर भी शामिल हैं, जो चैटबॉट द्वारा समझी जा सकने वाली जटिलता के स्तर को उजागर करते हैं। वे अनिवार्य रूप से तंत्रिका कनेक्शन हैं जहाँ प्रत्येक बिंदु एक निश्चित विषय के बारे में ज्ञान है, और यह ऐसे कई अन्य बिंदुओं से जुड़ता है जिनमें मूल बिंदु के संदर्भ में जानकारी होती है।
माइक्रोसॉफ्ट का दावा है – आंतरिक बेंचमार्किंग के आधार पर – कि चैबोट मिक्सट्रल 8x7B और GPT-3.5 जैसे मॉडलों को टक्कर देता है, जो SML से बहुत बड़े हैं। AI को चैट प्रारूप के लिए संरेखित किया गया है, जिसका अर्थ है कि यह संवादात्मक प्रश्नों का जवाब दे सकता है। तकनीकी दिग्गज कहते हैं, “हम 4.8T टोकन के लिए प्रशिक्षित 7B और 14B मॉडल के साथ कुछ प्रारंभिक पैरामीटर-स्केलिंग परिणाम भी प्रदान करते हैं, जिन्हें phi-3-small और phi-3-medium कहा जाता है, दोनों phi-3-mini की तुलना में काफी अधिक सक्षम हैं।”
रॉयटर्स की रिपोर्ट के अनुसार, सरल कार्यों को करने के लिए डिज़ाइन किया गया AI मॉडल Microsoft Azure और Ollama पर भी होस्ट किया गया है। कंपनी ने अभी तक Phi-3-mini के ओपन सोर्स लाइसेंस के बारे में विवरण साझा नहीं किया है। उल्लेखनीय रूप से, अपाचे 2.0 लाइसेंस, जिसे ग्रोक AI ने हाल ही में जारी किया है, शैक्षणिक और व्यावसायिक दोनों तरह के उपयोग की अनुमति देता है।
नवीनतम तकनीकी समाचारों और समीक्षाओं के लिए, गैजेट्स 360 को फ़ॉलो करें एक्सFacebook, WhatsApp, थ्रेड्स और Google News. गैजेट्स और तकनीक पर नवीनतम वीडियो के लिए, हमारे YouTube चैनल को सब्सक्राइब करें। यदि आप शीर्ष प्रभावशाली लोगों के बारे में सब कुछ जानना चाहते हैं, तो Instagram और YouTube पर हमारे इन-हाउस Who’sThat360 को फ़ॉलो करें।
सैमसंग गैलेक्सी रिंग मॉडल नंबर से पता चलता है कि कॉम्पैक्ट वियरेबल आठ आकारों में आएगा: रिपोर्ट