September 19, 2024
A.I

Microsoft Phi-3 Launched as Company’s Smallest Open-Source AI Model to Date

  • August 18, 2024
  • 1 min read
Microsoft Phi-3 Launched as Company’s Smallest Open-Source AI Model to Date

माइक्रोसॉफ्ट ने मंगलवार को अपना अब तक का सबसे छोटा लैंग्वेज आर्टिफिशियल इंटेलिजेंस (AI) मॉडल Phi-3 जारी किया। छोटे AI मॉडल महत्वपूर्ण हैं, क्योंकि उनमें स्मार्टफ़ोन पर चलने की क्षमता है। नवीनतम AI मॉडल Phi-2 का उत्तराधिकारी है, जिसे दिसंबर 2023 में जारी किया गया था, और यह उच्च प्रशिक्षण डेटाबेस और बड़े मापदंडों के साथ आता है। बढ़े हुए पैरामीटर AI मॉडल को अपने पूर्ववर्ती की तुलना में अधिक जटिल प्रश्नों को समझने और उनका जवाब देने में मदद करते हैं। यह भी दावा किया जाता है कि यह Phi-3 के लिए उपयोग किए जाने वाले मापदंडों की संख्या से 10 गुना से अधिक पर प्रशिक्षित मॉडल के बराबर है।

छोटे भाषा मॉडल (SLM) का विवरण देने वाला एक प्री-प्रिंट पेपर arXiv पर प्रकाशित किया गया है। हालाँकि, चूँकि arXiv सहकर्मी समीक्षा नहीं करता है, इसलिए दावों की वैधता का पता लगाना अभी बाकी है। AI के प्रति उत्साही Azure और Ollama के माध्यम से AI मॉडल का परीक्षण कर सकते हैं। Microsoft ने कहा कि AI मॉडल Nvidia NIM माइक्रोसर्विस पर एक मानक API इंटरफ़ेस के साथ भी उपलब्ध है, और इसे Nvidia GPU के लिए अनुकूलित किया गया है। Phi-3-mini के लिए एक हगिंग फेस कैटलॉग भी बनाया गया है, लेकिन वज़न अभी जारी नहीं किया गया है।

प्रदर्शन के मामले में, AI मॉडल को 3.3 ट्रिलियन टोकन पर प्रशिक्षित किया गया है – डेटा की इकाइयाँ जिनमें शब्द, वाक्यांश या शब्दों के उपखंड शामिल हैं जिन्हें AI मॉडल को प्रशिक्षित करने के लिए सिस्टम में फीड किया जाता है। इसमें 3.8 बिलियन पैरामीटर भी शामिल हैं, जो चैटबॉट द्वारा समझी जा सकने वाली जटिलता के स्तर को उजागर करते हैं। वे अनिवार्य रूप से तंत्रिका कनेक्शन हैं जहाँ प्रत्येक बिंदु एक निश्चित विषय के बारे में ज्ञान है, और यह ऐसे कई अन्य बिंदुओं से जुड़ता है जिनमें मूल बिंदु के संदर्भ में जानकारी होती है।

माइक्रोसॉफ्ट का दावा है – आंतरिक बेंचमार्किंग के आधार पर – कि चैबोट मिक्सट्रल 8x7B और GPT-3.5 जैसे मॉडलों को टक्कर देता है, जो SML से बहुत बड़े हैं। AI को चैट प्रारूप के लिए संरेखित किया गया है, जिसका अर्थ है कि यह संवादात्मक प्रश्नों का जवाब दे सकता है। तकनीकी दिग्गज कहते हैं, “हम 4.8T टोकन के लिए प्रशिक्षित 7B और 14B मॉडल के साथ कुछ प्रारंभिक पैरामीटर-स्केलिंग परिणाम भी प्रदान करते हैं, जिन्हें phi-3-small और phi-3-medium कहा जाता है, दोनों phi-3-mini की तुलना में काफी अधिक सक्षम हैं।”

रॉयटर्स की रिपोर्ट के अनुसार, सरल कार्यों को करने के लिए डिज़ाइन किया गया AI मॉडल Microsoft Azure और Ollama पर भी होस्ट किया गया है। कंपनी ने अभी तक Phi-3-mini के ओपन सोर्स लाइसेंस के बारे में विवरण साझा नहीं किया है। उल्लेखनीय रूप से, अपाचे 2.0 लाइसेंस, जिसे ग्रोक AI ने हाल ही में जारी किया है, शैक्षणिक और व्यावसायिक दोनों तरह के उपयोग की अनुमति देता है।


संबद्ध लिंक स्वचालित रूप से उत्पन्न हो सकते हैं – विवरण के लिए हमारा नैतिकता वक्तव्य देखें।

नवीनतम तकनीकी समाचारों और समीक्षाओं के लिए, गैजेट्स 360 को फ़ॉलो करें एक्सFacebook, WhatsApp, थ्रेड्स और Google News. गैजेट्स और तकनीक पर नवीनतम वीडियो के लिए, हमारे YouTube चैनल को सब्सक्राइब करें। यदि आप शीर्ष प्रभावशाली लोगों के बारे में सब कुछ जानना चाहते हैं, तो Instagram और YouTube पर हमारे इन-हाउस Who’sThat360 को फ़ॉलो करें।

सैमसंग गैलेक्सी रिंग मॉडल नंबर से पता चलता है कि कॉम्पैक्ट वियरेबल आठ आकारों में आएगा: रिपोर्ट



Source link

Leave a Reply

Your email address will not be published. Required fields are marked *

Solverwp- WordPress Theme and Plugin