OpenAI Develops CriticGPT Model Capable of Spotting GPT-4 Code Generation Errors
OpenAI ने गुरुवार को एक नए कृत्रिम बुद्धिमत्ता (AI) मॉडल के बारे में एक अध्ययन प्रकाशित किया जो कोड निर्माण में GPT-4 की गलतियों को पकड़ सकता है। एआई फर्म ने कहा कि नए चैटबॉट को मानव प्रतिक्रिया (आरएलएचएफ) ढांचे से सुदृढीकरण सीखने का उपयोग करके प्रशिक्षित किया गया था और यह जीपीटी -4 मॉडल में से एक द्वारा संचालित था। अंडर-डेवलपमेंट चैटबॉट को एआई-जनरेटेड कोड की गुणवत्ता में सुधार करने के लिए डिज़ाइन किया गया था जो उपयोगकर्ताओं को बड़े भाषा मॉडल से मिलता है। वर्तमान में, मॉडल उपयोगकर्ताओं या परीक्षकों के लिए उपलब्ध नहीं है। OpenAI ने मॉडल की कई सीमाओं पर भी प्रकाश डाला।
ओपनएआई ने क्रिटिकजीपीटी के बारे में विवरण साझा किया
एआई फर्म ने एक ब्लॉग पोस्ट में नए क्रिटिकजीपीटी मॉडल का विवरण साझा किया, जिसमें कहा गया कि यह जीपीटी-4 पर आधारित है और चैटजीपीटी द्वारा उत्पन्न कोड में त्रुटियों की पहचान करने के लिए डिज़ाइन किया गया है। कंपनी का दावा है, “हमने पाया कि जब लोगों को चैटजीपीटी कोड की समीक्षा करने के लिए क्रिटिकजीपीटी से मदद मिलती है तो वे 60 प्रतिशत समय बिना मदद वाले लोगों से बेहतर प्रदर्शन करते हैं।” मॉडल को आरएलएचएफ ढांचे का उपयोग करके विकसित किया गया था और निष्कर्ष एक पेपर में प्रकाशित किए गए हैं।
आरएलएचएफ एक मशीन लर्निंग तकनीक है जो एआई सिस्टम को प्रशिक्षित करने के लिए मशीन आउटपुट को इंसानों के साथ जोड़ती है। ऐसी प्रणाली में, मानव मूल्यांकनकर्ता एआई के प्रदर्शन पर प्रतिक्रिया प्रदान करते हैं। इसका उपयोग मॉडल के व्यवहार को समायोजित और सुधारने के लिए किया जाता है। जो मनुष्य AI को फीडबैक प्रदान करते हैं उन्हें AI प्रशिक्षक कहा जाता है।
क्रिटिकजीपीटी को बड़ी मात्रा में कोड डेटा पर प्रशिक्षित किया गया था जिसमें त्रुटियां थीं। एआई मॉडल को इन गलतियों को खोजने और कोड की आलोचना करने का काम सौंपा गया था। इसके लिए, एआई प्रशिक्षकों को स्वाभाविक रूप से होने वाली गलतियों के ऊपर कोड में गलतियों को लिखने के लिए कहा गया था, और फिर उदाहरण फीडबैक लिखने के लिए कहा गया था जैसे कि उन्होंने उन त्रुटियों को पकड़ लिया हो।
एक बार जब क्रिटिकजीपीटी ने अपनी आलोचना के कई रूप साझा किए, तो प्रशिक्षकों को यह पता लगाने के लिए कहा गया कि क्या उनके द्वारा डाली गई त्रुटियों को स्वाभाविक रूप से होने वाली त्रुटियों के साथ एआई द्वारा पकड़ा गया था। ओपनएआई ने अपने शोध में पाया कि त्रुटियों को पकड़ने में क्रिटिकजीपीटी ने चैटजीपीटी से 63 प्रतिशत बेहतर प्रदर्शन किया।
हालाँकि, मॉडल की अभी भी कुछ सीमाएँ हैं। क्रिटिकजीपीटी को ओपनएआई द्वारा उत्पन्न कोड की छोटी स्ट्रिंग पर प्रशिक्षित किया गया था। मॉडल को अभी भी कार्यों के लंबे और जटिल सेट पर प्रशिक्षित किया जाना बाकी है। एआई फर्म ने यह भी पाया कि नया चैटबॉट मतिभ्रम (गलत तथ्यात्मक प्रतिक्रियाएं उत्पन्न करना) जारी रखता है। इसके अलावा, मॉडल का परीक्षण उन परिदृश्यों में नहीं किया गया है जहां कोड में कई त्रुटियां फैली हुई हैं।
इस मॉडल को सार्वजनिक किए जाने की संभावना नहीं है क्योंकि इसे ओपनएआई को प्रशिक्षण तकनीकों को बेहतर ढंग से समझने में मदद करने के लिए डिज़ाइन किया गया है जो उच्च गुणवत्ता वाले आउटपुट उत्पन्न कर सकते हैं। यदि क्रिटिकजीपीटी इसे सार्वजनिक करता है, तो माना जाता है कि इसे चैटजीपीटी के भीतर एकीकृत किया गया है।
नवीनतम तकनीकी समाचारों और समीक्षाओं के लिए गैजेट्स 360 को फ़ॉलो करें एक्सफेसबुक, व्हाट्सएप, थ्रेड्स और गूगल न्यूज। गैजेट और तकनीक पर नवीनतम वीडियो के लिए, हमारे YouTube चैनल की सदस्यता लें। यदि आप शीर्ष प्रभावशाली व्यक्तियों के बारे में सब कुछ जानना चाहते हैं, तो इंस्टाग्राम और यूट्यूब पर हमारे इन-हाउस Who’sThat360 को फ़ॉलो करें।
बोलीविया ने बिटकॉइन प्रतिबंध को उलट दिया, बैंकों के लिए क्रिप्टो लेनदेन को वैध बना दिया