A.I

Google Releases Gemini 1.5 Pro AI Model in Public Preview, Adds New Features

Biplab Das August 18, 2024

0 27 2 minutes read

Google ने मंगलवार को अपने आर्टिफिशियल इंटेलिजेंस (AI) मॉडल को सबसे बड़ी संदर्भ विंडो, जेमिनी 1.5 प्रो के साथ सार्वजनिक पूर्वावलोकन में पेश किया। टेक दिग्गज ने सबसे पहले फरवरी में AI मॉडल की घोषणा की थी, और अगले दो महीनों के लिए, यह डेवलपर्स के लिए Google AI स्टूडियो में उपलब्ध था। अब, यह उपयोगकर्ताओं के लिए आज़माने के लिए उपलब्ध है। उत्साही लोग बड़े भाषा मॉडल (LLM) का उपयोग करके निर्माण करने के लिए API कुंजियाँ भी बना सकते हैं या उन तक पहुँच सकते हैं। इसे जनता के लिए खोलते हुए, टेक दिग्गज ने जेमिनी 1.5 प्रो में कई नई क्षमताएँ भी शामिल की हैं।

कंपनी के वार्षिक Google Cloud Next इवेंट के दौरान AI मॉडल को सार्वजनिक पूर्वावलोकन में पेश किया गया था। Gemini 1.5 Pro का मानक संस्करण 1,28,000 टोकन संदर्भ विंडो के साथ आता है। इसकी तुलना में, Gemini 1.0 में 32,000 टोकन की संदर्भ विंडो थी। मॉडल का एक विशेष संस्करण भी है जो एक मिलियन टोकन की विशाल संदर्भ विंडो के साथ आता है। टोकन डेटा की प्राथमिक इकाइयाँ हैं, जिन्हें शब्दांश, शब्द या शब्दों के उपखंडों के रूप में समझा जा सकता है। संदर्भ विंडो वह जानकारी की मात्रा है जिसे AI मॉडल प्रॉम्प्ट में कीवर्ड के आधार पर प्रासंगिक जानकारी खोजने के लिए एक्सेस कर सकता है।

इसे संदर्भ में रखने के लिए, एक मिलियन टोकन की संदर्भ विंडो लगभग 7,00,000 शब्द हो सकती है, जो 300 पृष्ठों वाली दस औसत आकार की पुस्तकों के समान है। इस तरह की सूचना प्रसार एआई को व्यापक संदर्भ को समझने और ऐसे उत्तर के साथ प्रतिक्रिया करने में सक्षम बनाता है जो उपयोगकर्ता के लिए अधिक प्रासंगिक हो सकता है। इसके अलावा, यह क्षमता विशेष रूप से तब उपयोगी होती है जब कोई उपयोगकर्ता चाहता है कि एआई किसी विशेष जानकारी का पता लगाने के लिए एक बड़ी फ़ाइल का विश्लेषण करे।

एक्स (पहले ट्विटर के नाम से जाना जाता था) उपयोगकर्ता रोवन चेउंग को जेमिनी एआई मॉडल तक शुरुआती पहुंच प्राप्त करने में सक्षम था और इसके उपयोग से प्राप्त निष्कर्षों के बारे में पोस्ट किया। डाकउन्होंने कहा, “मैंने कल रात से पूरा एनबीए डंक कॉन्टेस्ट अपलोड किया और पूछा कि किस डंक का स्कोर सबसे ज़्यादा था। जेमिनी 1.5 सिर्फ़ अपने लंबे संदर्भ वीडियो समझ से ही विशिष्ट परफेक्ट 50 डंक और विवरण खोजने में अविश्वसनीय रूप से सक्षम था!”

AI मॉडल में कई नए फीचर भी शामिल हैं। Google ने नेटिव ऑडियो या स्पीच सपोर्ट जोड़ा है और Gemini 1.5 Pro मौखिक संकेतों को समझ सकता है। साथ ही, मॉडल पर बेहतर नियंत्रण के लिए डेवलपर्स के लिए फ़ाइलों, सिस्टम निर्देशों और JSON मोड को संभालने के लिए एक फ़ाइल API भी जोड़ा गया है। यह अपनी मल्टीमॉडल क्षमता के साथ भी आता है और छवियों और वीडियो का विश्लेषण कर सकता है। AI मॉडल वर्तमान में भारत सहित 180 से अधिक देशों में उपलब्ध है।

संबद्ध लिंक स्वचालित रूप से उत्पन्न हो सकते हैं – विवरण के लिए हमारा नैतिकता वक्तव्य देखें।

Source link

Post Views: 56