Google Gemini 2.0 Family Unveiled, Gemini 2.0 Flash Added to the Chatbot on Web and Mobile Apps
Google ने बुधवार को AI मॉडल के जेमिनी 1.5 परिवार के उत्तराधिकारी को जेमिनी 2.0 नाम से पेश किया। कंपनी ने इस बात पर प्रकाश डाला कि नए एआई मॉडल छवि निर्माण और ऑडियो पीढ़ी के लिए मूल समर्थन सहित बेहतर क्षमताओं के साथ आते हैं। वर्तमान में, जेमिनी 2.0 मॉडल चुनिंदा डेवलपर्स और परीक्षकों के लिए बीटा में उपलब्ध है, जबकि जेमिनी 2.0 फ्लैश एआई मॉडल को सभी उपयोगकर्ताओं के लिए चैटबॉट के वेब और मोबाइल ऐप में जोड़ा गया है। Google ने कहा कि बड़े मॉडल को भी जल्द ही अपने उत्पादों में शामिल किया जाएगा।
Google जेमिनी 2.0 एआई मॉडल
एआई मॉडल की जेमिनी 1.5 श्रृंखला जारी होने के नौ महीने बाद, Google ने अब बड़े भाषा मॉडल (एलएलएम) का उन्नत संस्करण पेश किया है। एक ब्लॉग पोस्ट में, कंपनी ने घोषणा की कि वह जेमिनी 2.0 परिवार में पहला मॉडल जारी कर रही है – जेमिनी 2.0 फ्लैश का एक प्रायोगिक संस्करण। फ़्लैश मॉडल में आम तौर पर कम पैरामीटर होते हैं और यह जटिल कार्यों के लिए उपयुक्त नहीं है। हालाँकि, यह बड़े मॉडलों की तुलना में कम विलंबता और उच्च दक्षता के साथ इसकी भरपाई करता है।
माउंटेन व्यू-आधारित टेक दिग्गज ने इस बात पर प्रकाश डाला कि जेमिनी 2.0 फ्लैश अब मल्टीमॉडल आउटपुट जैसे टेक्स्ट के साथ इमेज जेनरेशन और स्टीयरेबल टेक्स्ट-टू-स्पीच (टीटीएस) बहुभाषी ऑडियो का समर्थन करता है। इसके अतिरिक्त, एआई मॉडल एजेंटिक कार्यों से भी सुसज्जित है। 2.0 फ़्लैश मूल रूप से Google खोज, कोड निष्पादन-संबंधित टूल, साथ ही तृतीय-पक्ष फ़ंक्शंस जैसे टूल को कॉल करता है, जब कोई उपयोगकर्ता उन्हें एपीआई के माध्यम से परिभाषित करता है।
प्रदर्शन की बात करें तो, Google ने आंतरिक परीक्षण के आधार पर जेमिनी 2.0 फ्लैश के बेंचमार्क स्कोर साझा किए। मैसिव मल्टीटास्क लैंग्वेज अंडरस्टैंडिंग (MMLU), नेचुरल2कोड, MATH और ग्रेजुएट-लेवल Google-प्रूफ Q&A (GPQA) बेंचमार्क पर, यह जेमिनी 1.5 प्रो मॉडल से भी बेहतर प्रदर्शन करता है।
जेमिनी उपयोगकर्ता वेब के शीर्ष बाईं ओर और मोबाइल ऐप इंटरफ़ेस के शीर्ष पर स्थित मॉडल चयनकर्ता विकल्प से प्रयोगात्मक मॉडल का चयन कर सकते हैं। इसके अलावा, AI मॉडल Google AI स्टूडियो और वर्टेक्स AI में जेमिनी एप्लिकेशन प्रोग्रामिंग इंटरफ़ेस (API) के माध्यम से भी उपलब्ध है। यह मॉडल डेवलपर्स के लिए मल्टीमॉडल इनपुट और टेक्स्ट आउटपुट के साथ उपलब्ध होगा। छवि और टेक्स्ट-टू-स्पीच क्षमताएं वर्तमान में केवल Google के शुरुआती पहुंच वाले भागीदारों के लिए उपलब्ध हैं।