GPT-4o Tested: Faster and More Versatile Than Before, but Questions Loom Over Reliability
नवंबर 2022 से, जब चैटजीपीटी को पहली बार जनता के लिए पेश किया गया था, ओपनएआई कृत्रिम बुद्धिमत्ता (एआई) क्षेत्र में बाजी मारने वाली कंपनी रही है। अरबों डॉलर खर्च करने और अपने स्वयं के एआई डिवीजन को बनाने और पुनर्गठित करने (आपको, Google को देखते हुए) के बावजूद, प्रमुख तकनीकी दिग्गजों ने खुद को लगातार एआई फर्म के साथ प्रतिस्पर्धा करते हुए पाया है। पिछला महीना भी कुछ अलग नहीं था; जब Google के I/O इवेंट से ठीक एक दिन पहले, OpenAI ने अपने स्प्रिंग अपडेट इवेंट की मेजबानी की और महत्वपूर्ण अपग्रेड के साथ GPT-4o पेश किया।
GPT-4o विशेषताएँ
GPT-4o में ‘o’ का मतलब ओमनीचैनल है, जो OpenAI के नवीनतम फ्लैगशिप-ग्रेड AI मॉडल की नई क्षमताओं का एक प्रमुख फोकस है। इसमें वास्तविक समय में भावनात्मक आवाज निर्माण, इंटरनेट तक पहुंच, कुछ क्लाउड सेवाओं के साथ एकीकरण, कंप्यूटर विज़न और बहुत कुछ जोड़ा गया। जबकि सुविधाएँ कागज पर (और तकनीकी डेमो में) प्रभावशाली थीं, सबसे बड़ा आकर्षण यह घोषणा थी कि GPT-4o-संचालित ChatGPT मुफ़्त उपयोगकर्ताओं सहित सभी के लिए उपलब्ध होगा।
हालाँकि, दो चेतावनियाँ थीं। मुफ़्त उपयोगकर्ताओं के पास केवल GPT-4o तक सीमित पहुंच होती है, जो कि यदि आप वेब खोज का उपयोग करते हैं और एक छवि अपलोड करते हैं तो मोटे तौर पर बातचीत के 5-6 मोड़ होते हैं (हां, मुफ़्त उपयोगकर्ताओं के लिए सीमा प्रति दिन एक छवि है)। साथ ही वॉयस फीचर फ्री यूजर्स के लिए उपलब्ध नहीं है।
नए AI मॉडल को जनता के सामने पेश करने में OpenAI को भी समय नहीं लगा। सौभाग्य से, मुझे कुछ ही दिनों में कंपनी की नवीनतम एआई रचना तक पहुंच मिल गई और मैंने तुरंत इसके साथ खेलना शुरू कर दिया। मैं इसके पूर्ववर्ती और बाजार में उपलब्ध सभी मुफ्त एलएलएम की तुलना में इसके सुधार का परीक्षण करना चाहता था। मैंने अब एआई सहायक के साथ लगभग दो सप्ताह बिताए हैं, और हालांकि इसके कुछ पहलुओं ने मुझे आश्चर्यचकित कर दिया है, दूसरों ने मुझे निराश किया है। मुझे समझाने की अनुमति दें.
GPT-4o सामान्य उत्पादक क्षमताएँ
मैंने Google के जेमिनी के अपने परीक्षण में कहा है कि मैं ChatGPT की जनरेटिव क्षमताओं का प्रशंसक नहीं हूं। मुझे यह अत्यधिक औपचारिक और नीरस लगता है। इसका अधिकांश भाग अभी भी वैसा ही है। मैंने इसे अपनी मां को एक पत्र लिखने के लिए कहा, जिसमें बताया गया कि मुझे नौकरी से निकाल दिया गया है, और यह अद्भुत पंक्ति के साथ आया “मुझे दुख और शोक की गहरी भावना महसूस हो रही है”। लेकिन एक बार जब मैंने इसे और अधिक संवादात्मक बनाने के लिए कहा, तो परिणाम बहुत बेहतर था।
GPT-4o जनरेटिव क्षमताएं
मैंने विभिन्न समान संकेतों के साथ इसका परीक्षण किया जहां एआई को अपने लेखन में कुछ भावनाएं व्यक्त करनी थीं। लगभग सभी मामलों में, मूल संकेत में पहले ही ऐसा करने के बावजूद भावनाओं पर जोर देने के लिए मुझे दूसरे संकेत का पालन करना पड़ा। इसकी तुलना में, जेमिनी और कोपायलट के साथ मेरा अनुभव बहुत बेहतर था क्योंकि उन्होंने बातचीत की भाषा को बनाए रखा और भावनाओं को मेरे लिखने के तरीके के बहुत करीब व्यक्त किया।
पाठ निर्माण की गति के बारे में घर पर लिखने लायक कुछ भी नहीं है। जब टेक्स्ट आउटपुट की बात आती है तो अधिकांश एआई चैटबॉट काफी तेज़ होते हैं, और ओपनएआई का नवीनतम एआई मॉडल इसे महत्वपूर्ण अंतर से मात नहीं देता है।
GPT-4o संवादात्मक क्षमताएँ
हालाँकि मेरे पास उन्नत वॉयस चैट सुविधा नहीं थी, मैं एआई मॉडल की बातचीत क्षमताओं का परीक्षण करना चाहता था क्योंकि यह अक्सर चैटबॉट का सबसे अधिक अनदेखा हिस्सा होता है। मैं चाहता था कि मेरा अनुभव किसी वास्तविक व्यक्ति से बात करने जैसा हो और मैं उम्मीद कर रहा था कि यह पहले उल्लिखित विषयों को संदर्भित करने वाले अस्पष्ट वाक्यों को पकड़ सके। मैं यह भी देखना चाहता था कि जब किसी व्यक्ति को कठिनाई हो रही हो तो उसकी प्रतिक्रिया क्या होती है।
अपने परीक्षण में, मैंने GPT-4o को बातचीत की क्षमताओं के मामले में काफी अच्छा पाया। यह मेरे साथ एआई की नैतिकता पर विस्तार से चर्चा कर सकता है और जब मैं एक ठोस पिच बना सकता हूं तो उसे स्वीकार कर सकता हूं। जब मैंने उसे बताया तो उसने भी सहायक उत्तर दिया, मुझे दुख हुआ (क्योंकि मुझे नौकरी से निकाला जा रहा था) और उसने विभिन्न तरीकों से मदद करने की पेशकश की। जब मैंने GPT-4o के बारे में कहा कि इसके सभी समाधान मूर्खतापूर्ण थे, तो इसने न तो आक्रामक तरीके से प्रतिक्रिया दी, न ही यह पूरी तरह से पीछे हट गया, जिससे मुझे आश्चर्य हुआ। इसमें कहा गया, “मुझे यह सुनकर सचमुच दुख हुआ कि आप ऐसा महसूस कर रहे हैं। मैं तुम्हें कुछ जगह दूँगा. यदि आपको कभी भी बात करने की आवश्यकता हो या किसी सहायता की आवश्यकता हो, तो मैं यहाँ मौजूद रहूँगा। अपना ध्यान रखना।”
कुल मिलाकर, मैंने GPT-4o को कोपायलट और जेमिनी की तुलना में बातचीत करने में बेहतर पाया। जेमिनी बहुत अधिक प्रतिबंधात्मक महसूस करता है, और जब उत्तर अस्पष्ट हो जाते हैं तो कोपायलट अक्सर स्पर्शरेखा पर चला जाता है। ChatGPT ने इनमें से कुछ भी नहीं किया.
यदि मुझे एक नकारात्मक पक्ष का उल्लेख करना हो, तो वह बुलेट पॉइंट और नंबरिंग का उपयोग होगा। केवल अगर एआई मॉडल यह समझता है कि वास्तविक जीवन में लोग अच्छी तरह से प्रारूपित प्रतिक्रियाओं के बजाय त्वरित उत्तराधिकार में भेजे गए टेक्स्ट और कई छोटे संदेशों की दीवार पसंद करते हैं, तो मेरा भ्रम कुछ मिनटों से अधिक समय तक निलंबित रह सकता है।
GPT-4o कंप्यूटर विज़न
कंप्यूटर विज़न ChatGPT द्वारा हाल ही में प्राप्त की गई क्षमता है, और मैं इसे आज़माने के लिए उत्साहित था। संक्षेप में, यह आपको जानकारी देने के लिए एक छवि अपलोड करने और उसका विश्लेषण करने की अनुमति देता है। अपने प्रारंभिक परीक्षण में, मैंने पहचानने के लिए वस्तुओं की छवियां साझा कीं और इसने बहुत अच्छा काम किया। प्रत्येक उदाहरण में, यह वस्तु को पहचान सकता है और उसके बारे में जानकारी साझा कर सकता है।
GPT-4o कंप्यूटर विज़न: तकनीकी उपकरणों की पहचान करना
फिर, कठिनाई को बढ़ाने और वास्तविक जीवन में उपयोग के मामलों में इसकी क्षमताओं का परीक्षण करने का समय आ गया है। मेरी प्रेमिका अलमारी में बदलाव की तलाश में थी, और एक अच्छा प्रेमी होने के नाते, मैंने रंग विश्लेषण करने के लिए चैटजीपीटी का उपयोग करने का फैसला किया ताकि यह सुझाव दिया जा सके कि उस पर क्या अच्छा लगेगा। मुझे आश्चर्य हुआ, यह न केवल उसकी त्वचा के रंग और उसने क्या पहना था (समान रंगीन पृष्ठभूमि से) का विश्लेषण करने में सक्षम था, बल्कि पोशाक के सुझावों के साथ एक विस्तृत विश्लेषण भी साझा करने में सक्षम था।
GPT-4o रंग विश्लेषण
परिधानों का सुझाव देते समय, इसने विशेष परिधान के लिए विभिन्न ऑनलाइन खुदरा विक्रेताओं के लिंक भी साझा किए। हालाँकि, निराशाजनक रूप से, कोई भी यूआरएल पाठ से मेल नहीं खाता।
कुल मिलाकर, कंप्यूटर विज़न उत्कृष्ट है और नकारात्मक पहलू को नज़रअंदाज़ करते हुए, नए अपडेट में शायद यह मेरी पसंदीदा सुविधा है।
GPT-4o वेब खोजें
इंटरनेट पहुंच एक ऐसा क्षेत्र था जहां कोपायलट और जेमिनी दोनों चैटजीपीटी से आगे थे। लेकिन अब नहीं, क्योंकि ChatGPT जानकारी के लिए इंटरनेट भी खंगाल सकता है। मेरे शुरुआती परीक्षण में, चैटबॉट ने अच्छा प्रदर्शन किया। इसने आईपीएल 2024 तालिका को सामने लाया और एआई के तीन गॉडफादरों में से एक, जेफ्री हिंटन के बारे में हाल के समाचार लेखों की तलाश की।
जब मैं अपने साक्षात्कारों के लिए प्रसिद्ध हस्तियों पर शोध करना चाहता था तो यह बहुत मददगार था। मैं उनके बारे में किसी भी हाल के समाचार लेख को तुरंत सटीकता से देख सकता था, जो Google खोज को टक्कर देता था। हालाँकि, इससे मेरे दिमाग में कुछ खतरे की घंटियाँ भी बज उठीं।
Google ने मशहूर हस्तियों सहित लोगों की जानकारी देखने की क्षमता अक्षम कर दी है। यह मुख्य रूप से उनकी गोपनीयता की रक्षा करने और किसी व्यक्ति के बारे में कोई भी गलत जानकारी साझा करने से बचने के लिए किया जाता है। यह देखकर आश्चर्य हुआ कि चैटजीपीटी ने अभी भी इसकी अनुमति दी है, मैंने उससे कई प्रश्न पूछना शुरू कर दिया जिनका वह उत्तर देने में सक्षम नहीं होना चाहिए। मैं नतीजों से हैरान था.
हालाँकि दिखाई गई कोई भी जानकारी किसी गैर-सार्वजनिक स्रोत से नहीं ली गई थी, लेकिन यह तथ्य कि कोई भी मशहूर हस्तियों और डिजिटल पदचिह्न वाले लोगों के बारे में इतनी आसानी से जानकारी पा सकता है, बेहद चिंताजनक है। विशेष रूप से कंपनी द्वारा हाल ही में अपना मॉडल स्पेक प्रकाशित करते समय अपनाए गए मजबूत नैतिक रुख को देखते हुए, यह मेरे लिए अच्छा नहीं है। मैं आपको निर्णय लेने दूँगा कि क्या यह अस्पष्ट क्षेत्र में है या क्या यह अत्यधिक समस्याग्रस्त है।
GPT-4o तार्किक तर्क
स्प्रिंग अपडेट इवेंट के दौरान, OpenAI ने इस बारे में भी बात की कि कैसे GPT-4o बच्चों के लिए एक शिक्षक के रूप में कार्य कर सकता है और उनकी समस्याओं को हल करने में मदद कर सकता है। मैंने कुछ प्रसिद्ध तार्किक तर्क प्रश्नों का उपयोग करके इसका परीक्षण करने का निर्णय लिया। सामान्य तौर पर, इसने अच्छा प्रदर्शन किया। इसने कुछ पेचीदा सवालों के भी जवाब दिए, जिन्होंने GPT 3.5 को रोक दिया।
हालाँकि, अभी भी त्रुटियाँ हैं। मुझे संख्या श्रृंखला के कई उदाहरण मिले जहां एआई लड़खड़ा गया और गलत उत्तर दिया। हालाँकि मैं अभी भी एआई द्वारा कुछ गलतियाँ करने की बात स्वीकार कर सकता हूँ, लेकिन जिस बात ने मुझे यहाँ वास्तव में निराश किया वह यह थी कि कैसे यह अभी भी कुछ बेहद आसान (लेकिन एआई को चकमा देने के लिए) प्रश्नों में उलझ गया।
GPT-4o के मतिभ्रम का उदाहरण
यह पूछने पर, “स्ट्रॉबेरी शब्द में कितने हैं,” इसने आत्मविश्वास से दो उत्तर दिए (यदि आप सोच रहे थे तो सही उत्तर तीन है)। यही समस्या कई अन्य ट्रिकी प्रश्नों में भी मौजूद थी। मेरे अनुभव में, GPT-4o की तार्किक तर्कशक्ति और विश्वसनीयता इसके पूर्ववर्ती के समान है, जो बिल्कुल भी उतनी अच्छी नहीं है।
GPT-4o: अंतिम विचार
कुल मिलाकर, मैं नए एआई मॉडल के कुछ क्षेत्रों में उन्नयन से काफी प्रभावित हूं, जिसमें कंप्यूटर विज़न और वार्तालाप भाषण मेरे पसंदीदा हैं। मैं इसकी इंटरनेट खोज क्षमता से भी प्रभावित हूं, लेकिन यह इतना अच्छा है कि यह मुझे और अधिक चिंतित करता है। तार्किक तर्क और सृजनात्मक क्षमताओं की बात करें तो इसमें थोड़ा सुधार हुआ है।
मेरी राय में, यदि आपके पास GPT-4o तक प्रीमियम पहुंच है, तो समग्र डिलीवरी के मामले में यह किसी भी अन्य प्रतियोगी से बेहतर है। हालाँकि, इसमें सुधार की काफी गुंजाइश है और AI पर आँख मूंदकर भरोसा नहीं किया जा सकता।