Elon Musk’s xAI Unveils Grok 1.5 Vision AI Model in Preview, To Compete With GPT-4 Vision and Gemini Pro 1.5
एलन मस्क की आर्टिफिशियल इंटेलिजेंस (AI) फर्म xAI ने Grok 1.5 Vision नामक एक नए AI मॉडल का अनावरण किया है। यह बड़ा भाषा मॉडल (LLM) हाल ही में जारी Grok 1.5 मॉडल का एक उन्नत संस्करण है। इस अपग्रेड के साथ, AI मॉडल अब कंप्यूटर विज़न से लैस है, जिससे यह इनपुट के रूप में विज़ुअल मीडिया को स्वीकार करने में सक्षम है। यह छवियों को संसाधित कर सकता है और इसके बारे में सवालों के जवाब दे सकता है। विशेष रूप से, यह घोषणा OpenAI द्वारा अपने स्वयं के कंप्यूटर विज़न-संचालित GPT-4 मॉडल को पेश करने के कुछ ही दिनों बाद हुई।
यह घोषणा xAI के आधिकारिक X (जिसे पहले Twitter के नाम से जाना जाता था) अकाउंट द्वारा की गई थी। फर्म ने नए AI मॉडल का विवरण देते हुए एक ब्लॉग पोस्ट साझा किया और इसके कुछ बेंचमार्क स्कोर साझा किए। चूंकि हाल ही में अनावरण किए गए Grok 1.5 मॉडल में विज़न क्षमताएँ जोड़ी गई थीं, इसलिए अधिकांश विवरण समान ही रहेंगे। इसमें 1,28,000 टोकन की समान संदर्भ विंडो है और सामान्य बेंचमार्क स्कोर भी समान रहने की संभावना है।
xAI ने कंपनी द्वारा विकसित बेंचमार्क पर परीक्षण किए गए Grok 1.5 Vision के बेंचमार्क स्कोर भी साझा किए। AI फर्म इसे RealWorldQA बेंचमार्क कहती है और यह “वास्तविक दुनिया की स्थानिक समझ” को मापता है। इसने MMMU, Mathvista, ChartQA और अन्य जैसे कई अन्य बेंचमार्क में भी मॉडल का परीक्षण किया। जबकि Grok ने RealWorldQA में Vision और Gemini 1.5 Pro के साथ OpenAI के GPT-4 से बेहतर प्रदर्शन किया, इसने MMMU और ChartQA में कम स्कोर किया।
जो लोग नहीं जानते, उनके लिए कंप्यूटर विज़न कंप्यूटर विज्ञान की एक शाखा है जो कंप्यूटर (और AI मॉडल) को छवियों और वीडियो का उपयोग करके वास्तविक दुनिया में वस्तुओं को पहचानने और समझने की क्षमता से लैस करने से संबंधित है। इसे कंप्यूटर को मनुष्यों की तरह दृश्य संकेतों को देखने और संसाधित करने में मदद करने के लिए डिज़ाइन किया गया है। मल्टीमॉडल AI मॉडल के उदय के साथ, कई फर्म अब विज़न-केंद्रित मॉडल विकसित करने पर ध्यान केंद्रित कर रही हैं। Google के Gemini 1.5 Pro और OpenAI के GPT-4 विद विज़न दोनों में यह क्षमता है।
यह तकनीक कई तरह के अनुप्रयोग भी प्रदान करती है। भारतीय कैलोरी ट्रैकिंग और पोषण फीडबैक प्लेटफ़ॉर्म हेल्थीफाई ने हाल ही में स्नैप नामक एक सुविधा जोड़ी है जहाँ उपयोगकर्ता किसी खाद्य पदार्थ या व्यंजन की तस्वीर क्लिक कर सकते हैं, और विज़न-संचालित एआई चैटबॉट के साथ जीपीटी-4 सुझाव देता है कि रेसिपी को कैसे स्वस्थ बनाया जा सकता है, और अतिरिक्त कैलोरी जलाने के लिए किसी को कितना व्यायाम करने की आवश्यकता है। भविष्य में, कंप्यूटर विज़न वाले एआई मॉडल बीमारियों के निदान, सेल्फ-ड्राइविंग कार बनाने और बहुत कुछ में सहायता कर सकते हैं।
नवीनतम तकनीकी समाचारों और समीक्षाओं के लिए, गैजेट्स 360 को फ़ॉलो करें एक्सFacebook, WhatsApp, थ्रेड्स और Google News. गैजेट्स और तकनीक पर नवीनतम वीडियो के लिए, हमारे YouTube चैनल को सब्सक्राइब करें। यदि आप शीर्ष प्रभावशाली लोगों के बारे में सब कुछ जानना चाहते हैं, तो Instagram और YouTube पर हमारे इन-हाउस Who’sThat360 को फ़ॉलो करें।
स्क्वायर एनिक्स का लक्ष्य 2027 तक फाइनल फैंटेसी 7 रीमेक ट्रिलॉजी में तीसरा गेम जारी करना है
IDC का कहना है कि iPhone शिपमेंट में गिरावट के कारण Apple ने शीर्ष फोन निर्माता का स्थान सैमसंग को दे दिया है