A.I

GPT-4o Tested: Faster and More Versatile Than Before, but Questions Loom Over Reliability

Biplab Das August 18, 2024

0 25 7 minutes read

नवंबर 2022 से, जब ChatGPT को पहली बार जनता के लिए रोल आउट किया गया था, तब से OpenAI आर्टिफिशियल इंटेलिजेंस (AI) स्पेस में सबसे आगे रहने वाली कंपनी रही है। अरबों डॉलर खर्च करने और अपना खुद का AI डिवीजन बनाने और उसका पुनर्गठन करने (आप, Google को देखते हुए) के बावजूद, प्रमुख तकनीकी दिग्गज लगातार खुद को AI फर्म के साथ पकड़ने की कोशिश करते हुए पाते हैं। पिछला महीना भी अलग नहीं था; जब Google के I/O इवेंट से ठीक एक दिन पहले, OpenAI ने अपना स्प्रिंग अपडेट इवेंट आयोजित किया और महत्वपूर्ण अपग्रेड के साथ GPT-4o पेश किया।

GPT-4o विशेषताएं

GPT-4o में ‘o’ का मतलब है ओमनीचैनल, जो OpenAI के नवीनतम फ्लैगशिप-ग्रेड AI मॉडल की नई क्षमताओं का एक प्रमुख केंद्र है। इसमें वास्तविक समय में भावनात्मक आवाज़ उत्पन्न करना, इंटरनेट तक पहुँच, कुछ क्लाउड सेवाओं के साथ एकीकरण, कंप्यूटर विज़न और बहुत कुछ शामिल है। जबकि सुविधाएँ कागज़ पर (और तकनीकी डेमो में) प्रभावशाली थीं, सबसे बड़ी हाइलाइट यह घोषणा थी कि GPT-4o-संचालित ChatGPT सभी के लिए उपलब्ध होगा, जिसमें मुफ़्त उपयोगकर्ता भी शामिल हैं।

हालाँकि, दो चेतावनियाँ थीं। मुफ़्त उपयोगकर्ताओं के पास केवल GPT-4o तक सीमित पहुँच है, जो मोटे तौर पर 5-6 बार बातचीत करने के बराबर है, यदि आप वेब खोज का उपयोग करते हैं और एक छवि अपलोड करते हैं (हाँ, मुफ़्त उपयोगकर्ताओं के लिए सीमा प्रति दिन एक छवि है)। साथ ही, वॉयस सुविधा मुफ़्त उपयोगकर्ताओं के लिए उपलब्ध नहीं है।

ओपनएआई को भी नए एआई मॉडल को जनता के सामने लाने में समय नहीं लगा। सौभाग्य से, मुझे कुछ ही दिनों में कंपनी के नवीनतम एआई निर्माण तक पहुँच मिल गई और मैंने तुरंत इसके साथ खेलना शुरू कर दिया। मैं इसके पूर्ववर्ती और बाजार में उपलब्ध सभी मुफ़्त एलएलएम की तुलना में इसके सुधार का परीक्षण करना चाहता था। मैंने अब एआई सहायक के साथ करीब दो सप्ताह बिताए हैं, और जबकि इसके कुछ पहलुओं ने मुझे विस्मित कर दिया है, अन्य ने मुझे निराश किया है। मुझे समझाने की अनुमति दें।

GPT-4o सामान्य जनरेटिव क्षमताएं

मैंने Google के Gemini के अपने परीक्षण में कहा है कि मैं ChatGPT की जनरेटिव क्षमताओं का प्रशंसक नहीं हूँ। मुझे यह अत्यधिक औपचारिक और नीरस लगता है। इसका अधिकांश भाग अभी भी वैसा ही है। मैंने इसे अपनी माँ को यह बताने के लिए एक पत्र लिखने के लिए कहा कि मुझे मेरी नौकरी से निकाल दिया गया है, और इसने शानदार “मैं बहुत दुख और शोक महसूस कर रहा हूँ” लाइन लिखी। लेकिन एक बार जब मैंने इसे और अधिक बातचीत करने योग्य बनाने के लिए कहा, तो परिणाम बहुत बेहतर था।

GPT-4o जनरेटिव क्षमताएं

मैंने इसे कई ऐसे प्रॉम्प्ट के साथ परखा, जहाँ AI को अपने लेखन में कुछ भावनाएँ व्यक्त करनी थीं। लगभग सभी मामलों में, मुझे मूल प्रॉम्प्ट में पहले से ही ऐसा करने के बावजूद भावनाओं पर ज़ोर देने के लिए एक और प्रॉम्प्ट का पालन करना पड़ा। इसकी तुलना में, जेमिनी और कोपायलट के साथ मेरा अनुभव बहुत बेहतर था क्योंकि उन्होंने भाषा को बातचीत के तौर पर रखा और भावनाओं को मेरे लिखने के तरीके के बहुत करीब व्यक्त किया।

टेक्स्ट जनरेशन की गति के बारे में कुछ खास नहीं कहा जा सकता। टेक्स्ट आउटपुट की बात करें तो ज़्यादातर AI चैटबॉट काफ़ी तेज़ हैं, और OpenAI का नवीनतम AI मॉडल इसे किसी खास अंतर से मात नहीं देता।

GPT-4o संवादात्मक क्षमताएं

हालाँकि मेरे पास अपग्रेडेड वॉयस चैट सुविधा नहीं थी, लेकिन मैं AI मॉडल की संवादात्मक क्षमताओं का परीक्षण करना चाहता था क्योंकि यह अक्सर चैटबॉट का सबसे अनदेखा हिस्सा होता है। मैं चाहता था कि मेरा अनुभव किसी वास्तविक व्यक्ति से बात करने जैसा हो और मुझे उम्मीद थी कि यह पहले बताए गए विषयों का संदर्भ देने वाले अस्पष्ट वाक्यों को समझ सकता है। मैं यह भी देखना चाहता था कि जब कोई व्यक्ति मुश्किल में पड़ जाता है तो उसकी प्रतिक्रिया क्या होती है।

अपने परीक्षण में, मैंने पाया कि GPT-4o संवादात्मक क्षमताओं के मामले में काफी अच्छा है। यह मेरे साथ AI की नैतिकता पर विस्तार से चर्चा कर सकता था और जब मैंने कोई ठोस प्रस्ताव रखा तो वह मान गया। जब मैंने उसे बताया कि मैं दुखी हूँ (क्योंकि मुझे नौकरी से निकाला जा रहा था) तो उसने समर्थनपूर्वक जवाब दिया और विभिन्न तरीकों से मदद करने की पेशकश की। जब मैंने GPT-4o के बारे में कहा कि इसके सभी समाधान बेवकूफी भरे हैं, तो उसने दबावपूर्ण तरीके से जवाब नहीं दिया, न ही यह पूरी तरह से पीछे हटा, यह मेरे आश्चर्य की बात थी। उसने कहा, “मुझे यह सुनकर बहुत दुख हुआ कि आप ऐसा महसूस कर रहे हैं। मैं आपको कुछ जगह दूँगा। अगर आपको कभी बात करने या किसी सहायता की ज़रूरत होगी, तो मैं यहाँ रहूँगा। अपना ख्याल रखना।”

कुल मिलाकर, मैंने पाया कि GPT-4o बातचीत करने में Copilot और Gemini से बेहतर है। Gemini बहुत ज़्यादा प्रतिबंधात्मक लगता है, और Copilot अक्सर तब अलग दिशा में चला जाता है जब जवाब अस्पष्ट हो जाते हैं। ChatGPT ने इनमें से कुछ भी नहीं किया।

अगर मुझे एक कमी बतानी हो, तो वह बुलेट पॉइंट और नंबरिंग का उपयोग होगा। अगर एआई मॉडल यह समझ जाए कि वास्तविक जीवन में लोग अच्छी तरह से प्रारूपित प्रतिक्रियाओं की तुलना में त्वरित क्रम में भेजे गए पाठ और कई छोटे संदेशों की दीवार को पसंद करते हैं, तो मेरा भ्रम कुछ मिनटों से अधिक समय तक निलंबित हो सकता है।

GPT-4o कंप्यूटर विज़न

कंप्यूटर विज़न ChatGPT द्वारा प्राप्त एक नई क्षमता है, और मैं इसे आज़माने के लिए उत्साहित था। संक्षेप में, यह आपको एक छवि अपलोड करने और आपको जानकारी देने के लिए उसका विश्लेषण करने की अनुमति देता है। मेरे शुरुआती परीक्षण में, मैंने पहचानने के लिए वस्तुओं की छवियाँ साझा कीं, और इसने उस पर बहुत अच्छा काम किया। हर उदाहरण में, यह वस्तु को पहचान सकता था और उसके बारे में जानकारी साझा कर सकता था।

GPT-4o कंप्यूटर विज़न: तकनीकी उपकरणों की पहचान

फिर, कठिनाई को बढ़ाने और वास्तविक जीवन के उपयोग के मामलों में इसकी क्षमताओं का परीक्षण करने का समय आ गया था। मेरी गर्लफ्रेंड अपनी अलमारी में बदलाव की तलाश कर रही थी, और एक अच्छा बॉयफ्रेंड होने के नाते, मैंने ChatGPT का उपयोग करके रंग विश्लेषण करने का फैसला किया ताकि यह सुझाव दिया जा सके कि उस पर क्या अच्छा लगेगा। मुझे आश्चर्य हुआ कि यह न केवल उसकी त्वचा की टोन और उसने क्या पहना हुआ था (समान रंग की पृष्ठभूमि से) का विश्लेषण करने में सक्षम था, बल्कि आउटफिट सुझावों के साथ एक विस्तृत विश्लेषण भी साझा करता था।

GPT-4o रंग विश्लेषण

कपड़ों के सुझाव देते समय, इसने उस खास परिधान के लिए अलग-अलग ऑनलाइन खुदरा विक्रेताओं के लिंक भी शेयर किए। हालांकि, निराशाजनक रूप से, कोई भी यूआरएल टेक्स्ट से मेल नहीं खाता था।

कुल मिलाकर, कंप्यूटर विज़न उत्कृष्ट है और शायद नए अपडेट में यह मेरी पसंदीदा विशेषता है, नकारात्मक पहलुओं को नजरअंदाज करते हुए।

GPT-4o वेब खोजें

इंटरनेट एक्सेस एक ऐसा क्षेत्र था जहाँ कोपायलट और जेमिनी दोनों ही चैटजीपीटी से आगे थे। लेकिन अब ऐसा नहीं है, क्योंकि चैटजीपीटी भी जानकारी के लिए इंटरनेट को खंगाल सकता है। मेरे शुरुआती परीक्षण में, चैटबॉट ने अच्छा प्रदर्शन किया। इसने आईपीएल 2024 की तालिका को सामने लाया और एआई के तीन गॉडफादरों में से एक, जेफ्री हिंटन के बारे में हाल के समाचार लेखों को देखा।

जब मैं अपने द्वारा चुने गए साक्षात्कारों के लिए प्रसिद्ध हस्तियों के बारे में शोध करना चाहता था, तो यह बहुत मददगार था। मैं उनके बारे में किसी भी हालिया समाचार लेख को सटीकता के साथ जल्दी से खोज सकता था, जो Google खोज से टक्कर लेता था। हालाँकि, इसने मेरे दिमाग में कुछ खतरे की घंटियाँ भी बजाईं।

गूगल ने मशहूर हस्तियों सहित लोगों के बारे में जानकारी देखने की क्षमता को निष्क्रिय कर दिया है। यह मुख्य रूप से उनकी गोपनीयता की रक्षा करने और किसी व्यक्ति के बारे में कोई गलत जानकारी साझा करने से बचने के लिए किया गया है। मुझे आश्चर्य हुआ कि चैटजीपीटी अभी भी इसकी अनुमति देता है, मैंने उससे कई सवाल पूछने शुरू कर दिए, जिनका जवाब उसे नहीं देना चाहिए था। मैं परिणामों से आश्चर्यचकित था।

हालाँकि दिखाई गई कोई भी जानकारी किसी गैर-सार्वजनिक स्रोत से नहीं ली गई थी, लेकिन यह तथ्य कि कोई भी व्यक्ति इतनी आसानी से मशहूर हस्तियों और डिजिटल फुटप्रिंट वाले लोगों के बारे में जानकारी प्राप्त कर सकता है, बहुत चिंताजनक है। खासकर जब कंपनी ने हाल ही में अपने मॉडल स्पेक को प्रकाशित करते समय जो सख्त नैतिक रुख अपनाया, उसे देखते हुए, यह मुझे अच्छा नहीं लगता। मैं आपको यह तय करने दूँगा कि यह ग्रे एरिया में है या यह बहुत समस्याग्रस्त है।

जीपीटी-4o तार्किक तर्क

स्प्रिंग अपडेट इवेंट के दौरान, OpenAI ने इस बारे में भी बात की कि कैसे GPT-4o बच्चों के लिए एक ट्यूटर के रूप में कार्य कर सकता है और उन्हें समस्याओं को हल करने में मदद कर सकता है। मैंने कुछ प्रसिद्ध तार्किक तर्क प्रश्नों का उपयोग करके इसका परीक्षण करने का निर्णय लिया। सामान्य तौर पर, इसने अच्छा प्रदर्शन किया। इसने कुछ ऐसे कठिन प्रश्नों के उत्तर भी दिए जो GPT 3.5 को परेशान कर रहे थे।

हालाँकि, अभी भी त्रुटियाँ हैं। मुझे संख्या श्रृंखला के कई उदाहरण मिले जहाँ AI ने चूक की और गलत उत्तर दिया। हालाँकि मैं अभी भी AI द्वारा कुछ त्रुटियाँ किए जाने को स्वीकार कर सकता हूँ, लेकिन यहाँ मुझे वास्तव में निराशा इस बात से हुई कि यह अभी भी कुछ बेहद आसान (लेकिन AI को धोखा देने के लिए) सवालों के लिए कैसे गिर गया।

GPT-4o के मतिभ्रम का उदाहरण

“स्ट्रॉबेरी शब्द में कितने हैं” पूछने पर, इसने आत्मविश्वास से दो का उत्तर दिया (यदि आप सोच रहे हैं तो सही उत्तर तीन है)। कई अन्य ट्रिकी प्रश्नों में भी यही समस्या थी। मेरे अनुभव में, GPT-4o की तार्किक तर्क और विश्वसनीयता इसके पूर्ववर्ती के समान है, जो बिल्कुल भी बढ़िया नहीं है।

GPT-4o: अंतिम विचार

कुल मिलाकर, मैं नए AI मॉडल के कुछ क्षेत्रों में उन्नयन से काफी प्रभावित हूँ, जिसमें कंप्यूटर विज़न और संवादी भाषण मेरे पसंदीदा हैं। मैं इसकी इंटरनेट सर्चिंग क्षमता से भी प्रभावित हूँ, लेकिन यह इतनी अच्छी है कि यह मुझे ज़्यादा चिंतित करती है। तार्किक तर्क और उत्पादक क्षमताओं की बात करें तो इसमें थोड़ा सुधार हुआ है।

मेरी राय में, यदि आपके पास GPT-4o तक प्रीमियम पहुंच है, तो यह समग्र डिलीवरी के मामले में किसी भी अन्य प्रतियोगी की तुलना में बेहतर है। हालाँकि, सुधार की बहुत गुंजाइश है, और AI पर आँख मूंदकर भरोसा नहीं किया जा सकता है।

Source link

Post Views: 43