September 19, 2024
A.I

Elon Musk’s xAI Unveils Grok 1.5 Vision AI Model in Preview, To Compete With GPT-4 Vision and Gemini Pro 1.5

  • August 18, 2024
  • 1 min read
Elon Musk’s xAI Unveils Grok 1.5 Vision AI Model in Preview, To Compete With GPT-4 Vision and Gemini Pro 1.5

एलन मस्क की आर्टिफिशियल इंटेलिजेंस (AI) फर्म xAI ने Grok 1.5 Vision नामक एक नए AI मॉडल का अनावरण किया है। यह बड़ा भाषा मॉडल (LLM) हाल ही में जारी Grok 1.5 मॉडल का एक उन्नत संस्करण है। इस अपग्रेड के साथ, AI मॉडल अब कंप्यूटर विज़न से लैस है, जिससे यह इनपुट के रूप में विज़ुअल मीडिया को स्वीकार करने में सक्षम है। यह छवियों को संसाधित कर सकता है और इसके बारे में सवालों के जवाब दे सकता है। विशेष रूप से, यह घोषणा OpenAI द्वारा अपने स्वयं के कंप्यूटर विज़न-संचालित GPT-4 मॉडल को पेश करने के कुछ ही दिनों बाद हुई।

यह घोषणा xAI के आधिकारिक X (जिसे पहले Twitter के नाम से जाना जाता था) अकाउंट द्वारा की गई थी। फर्म ने नए AI मॉडल का विवरण देते हुए एक ब्लॉग पोस्ट साझा किया और इसके कुछ बेंचमार्क स्कोर साझा किए। चूंकि हाल ही में अनावरण किए गए Grok 1.5 मॉडल में विज़न क्षमताएँ जोड़ी गई थीं, इसलिए अधिकांश विवरण समान ही रहेंगे। इसमें 1,28,000 टोकन की समान संदर्भ विंडो है और सामान्य बेंचमार्क स्कोर भी समान रहने की संभावना है।

xAI ने कंपनी द्वारा विकसित बेंचमार्क पर परीक्षण किए गए Grok 1.5 Vision के बेंचमार्क स्कोर भी साझा किए। AI फर्म इसे RealWorldQA बेंचमार्क कहती है और यह “वास्तविक दुनिया की स्थानिक समझ” को मापता है। इसने MMMU, Mathvista, ChartQA और अन्य जैसे कई अन्य बेंचमार्क में भी मॉडल का परीक्षण किया। जबकि Grok ने RealWorldQA में Vision और Gemini 1.5 Pro के साथ OpenAI के GPT-4 से बेहतर प्रदर्शन किया, इसने MMMU और ChartQA में कम स्कोर किया।

जो लोग नहीं जानते, उनके लिए कंप्यूटर विज़न कंप्यूटर विज्ञान की एक शाखा है जो कंप्यूटर (और AI मॉडल) को छवियों और वीडियो का उपयोग करके वास्तविक दुनिया में वस्तुओं को पहचानने और समझने की क्षमता से लैस करने से संबंधित है। इसे कंप्यूटर को मनुष्यों की तरह दृश्य संकेतों को देखने और संसाधित करने में मदद करने के लिए डिज़ाइन किया गया है। मल्टीमॉडल AI मॉडल के उदय के साथ, कई फर्म अब विज़न-केंद्रित मॉडल विकसित करने पर ध्यान केंद्रित कर रही हैं। Google के Gemini 1.5 Pro और OpenAI के GPT-4 विद विज़न दोनों में यह क्षमता है।

यह तकनीक कई तरह के अनुप्रयोग भी प्रदान करती है। भारतीय कैलोरी ट्रैकिंग और पोषण फीडबैक प्लेटफ़ॉर्म हेल्थीफाई ने हाल ही में स्नैप नामक एक सुविधा जोड़ी है जहाँ उपयोगकर्ता किसी खाद्य पदार्थ या व्यंजन की तस्वीर क्लिक कर सकते हैं, और विज़न-संचालित एआई चैटबॉट के साथ जीपीटी-4 सुझाव देता है कि रेसिपी को कैसे स्वस्थ बनाया जा सकता है, और अतिरिक्त कैलोरी जलाने के लिए किसी को कितना व्यायाम करने की आवश्यकता है। भविष्य में, कंप्यूटर विज़न वाले एआई मॉडल बीमारियों के निदान, सेल्फ-ड्राइविंग कार बनाने और बहुत कुछ में सहायता कर सकते हैं।


संबद्ध लिंक स्वचालित रूप से उत्पन्न हो सकते हैं – विवरण के लिए हमारा नैतिकता वक्तव्य देखें।

नवीनतम तकनीकी समाचारों और समीक्षाओं के लिए, गैजेट्स 360 को फ़ॉलो करें एक्सFacebook, WhatsApp, थ्रेड्स और Google News. गैजेट्स और तकनीक पर नवीनतम वीडियो के लिए, हमारे YouTube चैनल को सब्सक्राइब करें। यदि आप शीर्ष प्रभावशाली लोगों के बारे में सब कुछ जानना चाहते हैं, तो Instagram और YouTube पर हमारे इन-हाउस Who’sThat360 को फ़ॉलो करें।

स्क्वायर एनिक्स का लक्ष्य 2027 तक फाइनल फैंटेसी 7 रीमेक ट्रिलॉजी में तीसरा गेम जारी करना है


IDC का कहना है कि iPhone शिपमेंट में गिरावट के कारण Apple ने शीर्ष फोन निर्माता का स्थान सैमसंग को दे दिया है



Source link

Leave a Reply

Your email address will not be published. Required fields are marked *

Solverwp- WordPress Theme and Plugin