Google Releases Gemini 1.5 Pro AI Model in Public Preview, Adds New Features
Google ने मंगलवार को अपने आर्टिफिशियल इंटेलिजेंस (AI) मॉडल को सबसे बड़ी संदर्भ विंडो, जेमिनी 1.5 प्रो के साथ सार्वजनिक पूर्वावलोकन में पेश किया। टेक दिग्गज ने सबसे पहले फरवरी में AI मॉडल की घोषणा की थी, और अगले दो महीनों के लिए, यह डेवलपर्स के लिए Google AI स्टूडियो में उपलब्ध था। अब, यह उपयोगकर्ताओं के लिए आज़माने के लिए उपलब्ध है। उत्साही लोग बड़े भाषा मॉडल (LLM) का उपयोग करके निर्माण करने के लिए API कुंजियाँ भी बना सकते हैं या उन तक पहुँच सकते हैं। इसे जनता के लिए खोलते हुए, टेक दिग्गज ने जेमिनी 1.5 प्रो में कई नई क्षमताएँ भी शामिल की हैं।
कंपनी के वार्षिक Google Cloud Next इवेंट के दौरान AI मॉडल को सार्वजनिक पूर्वावलोकन में पेश किया गया था। Gemini 1.5 Pro का मानक संस्करण 1,28,000 टोकन संदर्भ विंडो के साथ आता है। इसकी तुलना में, Gemini 1.0 में 32,000 टोकन की संदर्भ विंडो थी। मॉडल का एक विशेष संस्करण भी है जो एक मिलियन टोकन की विशाल संदर्भ विंडो के साथ आता है। टोकन डेटा की प्राथमिक इकाइयाँ हैं, जिन्हें शब्दांश, शब्द या शब्दों के उपखंडों के रूप में समझा जा सकता है। संदर्भ विंडो वह जानकारी की मात्रा है जिसे AI मॉडल प्रॉम्प्ट में कीवर्ड के आधार पर प्रासंगिक जानकारी खोजने के लिए एक्सेस कर सकता है।
इसे संदर्भ में रखने के लिए, एक मिलियन टोकन की संदर्भ विंडो लगभग 7,00,000 शब्द हो सकती है, जो 300 पृष्ठों वाली दस औसत आकार की पुस्तकों के समान है। इस तरह की सूचना प्रसार एआई को व्यापक संदर्भ को समझने और ऐसे उत्तर के साथ प्रतिक्रिया करने में सक्षम बनाता है जो उपयोगकर्ता के लिए अधिक प्रासंगिक हो सकता है। इसके अलावा, यह क्षमता विशेष रूप से तब उपयोगी होती है जब कोई उपयोगकर्ता चाहता है कि एआई किसी विशेष जानकारी का पता लगाने के लिए एक बड़ी फ़ाइल का विश्लेषण करे।
एक्स (पहले ट्विटर के नाम से जाना जाता था) उपयोगकर्ता रोवन चेउंग को जेमिनी एआई मॉडल तक शुरुआती पहुंच प्राप्त करने में सक्षम था और इसके उपयोग से प्राप्त निष्कर्षों के बारे में पोस्ट किया। डाकउन्होंने कहा, “मैंने कल रात से पूरा एनबीए डंक कॉन्टेस्ट अपलोड किया और पूछा कि किस डंक का स्कोर सबसे ज़्यादा था। जेमिनी 1.5 सिर्फ़ अपने लंबे संदर्भ वीडियो समझ से ही विशिष्ट परफेक्ट 50 डंक और विवरण खोजने में अविश्वसनीय रूप से सक्षम था!”
AI मॉडल में कई नए फीचर भी शामिल हैं। Google ने नेटिव ऑडियो या स्पीच सपोर्ट जोड़ा है और Gemini 1.5 Pro मौखिक संकेतों को समझ सकता है। साथ ही, मॉडल पर बेहतर नियंत्रण के लिए डेवलपर्स के लिए फ़ाइलों, सिस्टम निर्देशों और JSON मोड को संभालने के लिए एक फ़ाइल API भी जोड़ा गया है। यह अपनी मल्टीमॉडल क्षमता के साथ भी आता है और छवियों और वीडियो का विश्लेषण कर सकता है। AI मॉडल वर्तमान में भारत सहित 180 से अधिक देशों में उपलब्ध है।