OpenAI Said to Be Working on New Reasoning Technology Under Code Name ‘Strawberry’
मामले से परिचित एक व्यक्ति और रॉयटर्स द्वारा समीक्षा किए गए आंतरिक दस्तावेज़ के अनुसार, चैटजीपीटी निर्माता ओपनएआई “स्ट्रॉबेरी” नाम के एक प्रोजेक्ट में अपने कृत्रिम बुद्धिमत्ता मॉडल के लिए एक नए दृष्टिकोण पर काम कर रहा है।
परियोजना, जिसका विवरण पहले रिपोर्ट नहीं किया गया है, माइक्रोसॉफ्ट-समर्थित स्टार्टअप दौड़ के रूप में यह दिखाने के लिए आता है कि यह जिस प्रकार के मॉडल पेश करता है वह उन्नत तर्क क्षमता प्रदान करने में सक्षम हैं।
मई में रॉयटर्स द्वारा देखे गए हालिया आंतरिक ओपनएआई दस्तावेज़ की एक प्रति के अनुसार, ओपनएआई के अंदर की टीमें स्ट्रॉबेरी पर काम कर रही हैं। रॉयटर्स दस्तावेज़ की सटीक तारीख का पता नहीं लगा सके, जिसमें एक योजना का विवरण दिया गया है कि ओपनएआई अनुसंधान करने के लिए स्ट्रॉबेरी का उपयोग कैसे करना चाहता है। सूत्र ने रॉयटर्स को इस योजना को प्रगति पर काम बताया। समाचार एजेंसी यह स्थापित नहीं कर सकी कि स्ट्रॉबेरी सार्वजनिक रूप से उपलब्ध होने के कितने करीब है।
व्यक्ति ने कहा कि स्ट्रॉबेरी कैसे काम करती है यह ओपनएआई के भीतर भी एक गुप्त रहस्य रखा गया है।
दस्तावेज़ एक परियोजना का वर्णन करता है जो स्ट्रॉबेरी मॉडल का उपयोग करता है जिसका उद्देश्य कंपनी के एआई को न केवल प्रश्नों के उत्तर उत्पन्न करने में सक्षम बनाना है, बल्कि इंटरनेट को स्वायत्त रूप से और विश्वसनीय रूप से नेविगेट करने के लिए पर्याप्त योजना बनाना है, जिसे ओपनएआई “गहन शोध” कहता है। .
एक दर्जन से अधिक एआई शोधकर्ताओं के साक्षात्कार के अनुसार, यह कुछ ऐसा है जो आज तक एआई मॉडल से दूर है।
स्ट्रॉबेरी और इस कहानी में बताए गए विवरण के बारे में पूछे जाने पर ओपनएआई कंपनी के प्रवक्ता ने एक बयान में कहा: “हम चाहते हैं कि हमारे एआई मॉडल दुनिया को हमारी तरह ही देखें और समझें। नई एआई क्षमताओं पर निरंतर शोध उद्योग में एक आम बात है, एक साझा विश्वास के साथ कि ये प्रणालियाँ समय के साथ तर्क में सुधार करेंगी।
प्रवक्ता ने सीधे तौर पर स्ट्रॉबेरी के बारे में सवालों का जवाब नहीं दिया।
स्ट्रॉबेरी प्रोजेक्ट को पहले Q* के नाम से जाना जाता था, जिसके बारे में रॉयटर्स ने पिछले साल रिपोर्ट दी थी, जिसे कंपनी के अंदर पहले से ही एक सफलता के रूप में देखा जा रहा था।
दो स्रोतों ने इस साल की शुरुआत में देखने का वर्णन किया था कि ओपनएआई के कर्मचारियों ने उन्हें क्यू * डेमो बताया था, जो आज के व्यावसायिक रूप से उपलब्ध मॉडल की पहुंच से बाहर मुश्किल विज्ञान और गणित के सवालों का जवाब देने में सक्षम है।
ब्लूमबर्ग के अनुसार, मंगलवार को एक आंतरिक ऑल-हैंड मीटिंग में ओपनएआई ने एक शोध परियोजना का डेमो दिखाया, जिसमें दावा किया गया कि इसमें मानव जैसे नए तर्क कौशल हैं। ओपनएआई के प्रवक्ता ने बैठक की पुष्टि की लेकिन सामग्री का विवरण देने से इनकार कर दिया। रॉयटर्स यह निर्धारित नहीं कर सका कि प्रदर्शित परियोजना स्ट्रॉबेरी थी या नहीं।
ओपनएआई को उम्मीद है कि यह नवाचार उसके एआई मॉडल की तर्क क्षमताओं में नाटकीय रूप से सुधार करेगा, इससे परिचित व्यक्ति ने कहा, स्ट्रॉबेरी में बहुत बड़े डेटासेट पर पूर्व-प्रशिक्षित होने के बाद एआई मॉडल को संसाधित करने का एक विशेष तरीका शामिल है।
रॉयटर्स के साक्षात्कार में शोधकर्ताओं का कहना है कि मानव या सुपर-मानव-स्तर की बुद्धिमत्ता प्राप्त करने के लिए एआई के लिए तर्क महत्वपूर्ण है।
जबकि बड़े भाषा मॉडल पहले से ही घने पाठों को संक्षेप में प्रस्तुत कर सकते हैं और किसी भी इंसान की तुलना में कहीं अधिक तेजी से सुरुचिपूर्ण गद्य की रचना कर सकते हैं, तकनीक अक्सर सामान्य ज्ञान की समस्याओं पर कम पड़ जाती है जिनके समाधान लोगों को सहज लगते हैं, जैसे तार्किक भ्रांतियों को पहचानना और टिक-टैक-टो खेलना। जब मॉडल इस प्रकार की समस्याओं का सामना करता है, तो यह अक्सर फर्जी जानकारी को “मतिभ्रम” करता है।
रॉयटर्स द्वारा साक्षात्कार किए गए एआई शोधकर्ता आम तौर पर इस बात से सहमत हैं कि एआई के संदर्भ में तर्क में एक मॉडल का निर्माण शामिल है जो एआई को आगे की योजना बनाने में सक्षम बनाता है, यह प्रतिबिंबित करता है कि भौतिक दुनिया कैसे काम करती है, और चुनौतीपूर्ण बहु-चरणीय समस्याओं के माध्यम से विश्वसनीय रूप से काम करती है।
एआई मॉडल में तर्क में सुधार को प्रमुख वैज्ञानिक खोजों से लेकर योजना बनाने और नए सॉफ्टवेयर अनुप्रयोगों के निर्माण तक सब कुछ करने की मॉडल की क्षमता को अनलॉक करने की कुंजी के रूप में देखा जाता है।
ओपनएआई के सीईओ सैम ऑल्टमैन ने इस साल की शुरुआत में कहा था कि एआई में “प्रगति का सबसे महत्वपूर्ण क्षेत्र तर्क क्षमता के आसपास होगा।”
Google, मेटा और Microsoft जैसी अन्य कंपनियाँ भी AI मॉडल में तर्क को बेहतर बनाने के लिए विभिन्न तकनीकों के साथ प्रयोग कर रही हैं, जैसे कि अधिकांश शैक्षणिक प्रयोगशालाएँ जो AI अनुसंधान करती हैं। हालाँकि, शोधकर्ता इस बात पर भिन्न हैं कि क्या बड़े भाषा मॉडल (एलएलएम) विचारों और दीर्घकालिक योजना को शामिल करने में सक्षम हैं कि वे कैसे भविष्यवाणी करते हैं। उदाहरण के लिए, आधुनिक एआई के अग्रदूतों में से एक, यान लेकुन, जो मेटा में काम करते हैं, ने अक्सर कहा है कि एलएलएम मानवीय तर्क करने में सक्षम नहीं हैं।
एआई चुनौतियाँ
मामले से परिचित सूत्र ने कहा कि स्ट्रॉबेरी उन चुनौतियों से पार पाने के लिए ओपनएआई की योजना का एक प्रमुख घटक है। रॉयटर्स द्वारा देखे गए दस्तावेज़ में बताया गया है कि स्ट्रॉबेरी का उद्देश्य क्या सक्षम करना है, लेकिन कैसे नहीं।
कंपनी की बातें सुनने वाले चार लोगों के अनुसार, हाल के महीनों में कंपनी निजी तौर पर डेवलपर्स और अन्य बाहरी पार्टियों को संकेत दे रही है कि वह काफी अधिक उन्नत तर्क क्षमताओं के साथ प्रौद्योगिकी जारी करने के कगार पर है। उन्होंने पहचान बताने से इनकार कर दिया क्योंकि वे निजी मामलों पर बोलने के लिए अधिकृत नहीं हैं।
स्ट्रॉबेरी में एक विशेष तरीका शामिल है जिसे “पोस्ट-ट्रेनिंग” ओपनएआई के जेनरेटिव एआई मॉडल के रूप में जाना जाता है, या सामान्यीकृत डेटा के दायरे में पहले से ही “प्रशिक्षित” होने के बाद विशिष्ट तरीकों से अपने प्रदर्शन को बेहतर बनाने के लिए बेस मॉडल को अनुकूलित करना शामिल है, स्रोतों में से एक कहा।
किसी मॉडल को विकसित करने के प्रशिक्षण के बाद के चरण में “फाइन-ट्यूनिंग” जैसी विधियाँ शामिल होती हैं, जो आज लगभग सभी भाषा मॉडलों पर उपयोग की जाने वाली प्रक्रिया है जो कई स्वादों में आती है, जैसे कि मनुष्य अपनी प्रतिक्रियाओं के आधार पर मॉडल को प्रतिक्रिया देते हैं और उदाहरणों को खिलाते हैं। अच्छे और बुरे उत्तरों का.
मामले की जानकारी रखने वाले सूत्रों में से एक ने कहा, स्ट्रॉबेरी में 2022 में स्टैनफोर्ड में विकसित “सेल्फ-टीटेड रीज़नर” या “एसटीएआर” नामक एक विधि की समानता है। एसटीआर एआई मॉडल को पुनरावृत्तीय रूप से निर्माण के माध्यम से उच्च खुफिया स्तरों में खुद को “बूटस्ट्रैप” करने में सक्षम बनाता है। इसके रचनाकारों में से एक, स्टैनफोर्ड के प्रोफेसर नूह गुडमैन ने रॉयटर्स को बताया कि उनके स्वयं के प्रशिक्षण डेटा, और सिद्धांत रूप में मानव-स्तर की बुद्धि को पार करने के लिए भाषा मॉडल प्राप्त करने के लिए उपयोग किया जा सकता है।
गुडमैन ने कहा, “मुझे लगता है कि यह रोमांचक और डरावना दोनों है… अगर चीजें इसी दिशा में चलती रहीं तो इंसान होने के नाते हमारे पास सोचने के लिए कुछ गंभीर बातें हैं।” गुडमैन ओपनएआई से संबद्ध नहीं है और स्ट्रॉबेरी से परिचित नहीं है।
दस्तावेज़ में कहा गया है कि ओपनएआई स्ट्रॉबेरी को जिन क्षमताओं के लिए लक्षित कर रहा है, उनमें लंबी-क्षितिज कार्य (एलएचटी) करना शामिल है, जिसमें उन जटिल कार्यों का जिक्र किया गया है जिनके लिए एक मॉडल को आगे की योजना बनाने और विस्तारित अवधि में कार्यों की एक श्रृंखला करने की आवश्यकता होती है, पहला स्रोत समझाया गया है .
ऐसा करने के लिए, OpenAI आंतरिक दस्तावेज़ीकरण के अनुसार, OpenAI उस मॉडल का निर्माण, प्रशिक्षण और मूल्यांकन कर रहा है जिसे कंपनी “गहन-अनुसंधान” डेटासेट कहती है। रॉयटर्स यह निर्धारित करने में असमर्थ था कि उस डेटासेट में क्या है या विस्तारित अवधि का मतलब कितना होगा।
ओपनएआई विशेष रूप से चाहता है कि उसके मॉडल “सीयूए” या कंप्यूटर का उपयोग करने वाले एजेंट की सहायता से स्वायत्त रूप से वेब ब्राउज़ करके अनुसंधान करने के लिए इन क्षमताओं का उपयोग करें, जो दस्तावेज़ और इनमें से एक के अनुसार अपने निष्कर्षों के आधार पर कार्रवाई कर सकता है। स्रोत. OpenAI सॉफ्टवेयर और मशीन लर्निंग इंजीनियरों के काम करने की अपनी क्षमताओं का परीक्षण करने की भी योजना बना रहा है।
© थॉमसन रॉयटर्स 2024