A.I

OpenAI Said to Be Working on New Reasoning Technology Under Code Name ‘Strawberry’

Biplab Das August 18, 2024

0 19 6 minutes read

चैटजीपीटी निर्माता ओपनएआई अपने कृत्रिम बुद्धिमत्ता मॉडल के लिए एक नए दृष्टिकोण पर काम कर रहा है, जिसका नाम “स्ट्रॉबेरी” है, यह जानकारी मामले से परिचित एक व्यक्ति और रॉयटर्स द्वारा समीक्षा किए गए आंतरिक दस्तावेज़ों से मिली है।

यह परियोजना, जिसका विवरण पहले नहीं दिया गया था, ऐसे समय में सामने आई है जब माइक्रोसॉफ्ट समर्थित स्टार्टअप यह दिखाने की कोशिश कर रहा है कि वह जिस प्रकार के मॉडल प्रस्तुत करता है, वे उन्नत तर्क क्षमताएं प्रदान करने में सक्षम हैं।

मई में रॉयटर्स द्वारा देखी गई ओपनएआई के हाल ही के आंतरिक दस्तावेज़ की एक प्रति के अनुसार, ओपनएआई के अंदर की टीमें स्ट्रॉबेरी पर काम कर रही हैं। रॉयटर्स दस्तावेज़ की सटीक तारीख का पता नहीं लगा सका, जिसमें ओपनएआई द्वारा शोध करने के लिए स्ट्रॉबेरी का उपयोग करने की योजना का विवरण दिया गया है। स्रोत ने रॉयटर्स को योजना को प्रगति पर काम के रूप में वर्णित किया। समाचार एजेंसी यह स्थापित नहीं कर सकी कि स्ट्रॉबेरी सार्वजनिक रूप से उपलब्ध होने के कितने करीब है।

सूत्र ने बताया कि स्ट्रॉबेरी कैसे काम करती है, यह बात ओपनएआई के भीतर भी गुप्त रखी गई है।

स्रोत के अनुसार, दस्तावेज़ में एक परियोजना का वर्णन किया गया है, जो स्ट्रॉबेरी मॉडल का उपयोग करती है, जिसका उद्देश्य कंपनी के AI को न केवल प्रश्नों के उत्तर उत्पन्न करने में सक्षम बनाना है, बल्कि इंटरनेट पर स्वायत्तता और विश्वसनीयता से नेविगेट करने के लिए पर्याप्त रूप से आगे की योजना बनाना है, जिसे OpenAI “गहन अनुसंधान” कहता है।

एक दर्जन से अधिक एआई शोधकर्ताओं के साक्षात्कारों के अनुसार, यह एक ऐसी चीज है जो आज तक एआई मॉडलों से दूर रही है।

स्ट्रॉबेरी और इस कहानी में बताए गए विवरणों के बारे में पूछे जाने पर, ओपनएआई कंपनी के प्रवक्ता ने एक बयान में कहा: “हम चाहते हैं कि हमारे एआई मॉडल दुनिया को वैसे ही देखें और समझें जैसे हम देखते हैं। नई एआई क्षमताओं पर निरंतर शोध उद्योग में एक आम बात है, इस साझा विश्वास के साथ कि ये सिस्टम समय के साथ तर्क में सुधार करेंगे।”

प्रवक्ता ने स्ट्रॉबेरी के बारे में सीधे तौर पर कोई सवाल नहीं उठाया।

स्ट्रॉबेरी परियोजना को पहले Q* के नाम से जाना जाता था, जिसके बारे में पिछले वर्ष रॉयटर्स ने बताया था कि कंपनी के अंदर इसे एक सफलता के रूप में देखा जा रहा है।

दो सूत्रों ने बताया कि इस वर्ष की शुरुआत में उन्होंने ओपनएआई के कर्मचारियों से जो कुछ देखा था, उससे उन्हें पता चला कि यह क्यू* डेमो था, जो विज्ञान और गणित के उन मुश्किल सवालों के जवाब देने में सक्षम था, जो आज के व्यावसायिक रूप से उपलब्ध मॉडलों की पहुंच से बाहर थे।

ब्लूमबर्ग के अनुसार, मंगलवार को एक आंतरिक सर्व-हाथ बैठक में, ओपनएआई ने एक शोध परियोजना का डेमो दिखाया, जिसके बारे में उसका दावा है कि इसमें नए मानव-जैसे तर्क कौशल हैं। ओपनएआई के प्रवक्ता ने बैठक की पुष्टि की, लेकिन विषय-वस्तु का विवरण देने से इनकार कर दिया। रॉयटर्स यह निर्धारित नहीं कर सका कि प्रदर्शित परियोजना स्ट्रॉबेरी थी या नहीं।

ओपनएआई को उम्मीद है कि यह नवाचार उसके एआई मॉडल की तर्क क्षमताओं में नाटकीय रूप से सुधार करेगा, इस मामले से परिचित एक व्यक्ति ने कहा, स्ट्रॉबेरी में एआई मॉडल को बहुत बड़े डेटासेट पर पूर्व-प्रशिक्षित करने के बाद प्रसंस्करण का एक विशेष तरीका शामिल है।

रॉयटर्स द्वारा साक्षात्कार किये गए शोधकर्ताओं का कहना है कि एआई द्वारा मानव या अति-मानव स्तर की बुद्धिमत्ता प्राप्त करने के लिए तर्क ही कुंजी है।

जबकि बड़े भाषा मॉडल पहले से ही सघन पाठों को संक्षेप में प्रस्तुत कर सकते हैं और किसी भी इंसान की तुलना में कहीं ज़्यादा तेज़ी से सुंदर गद्य लिख सकते हैं, तकनीक अक्सर सामान्य ज्ञान की समस्याओं पर कम पड़ जाती है, जिनके समाधान लोगों को सहज लगते हैं, जैसे तार्किक भ्रांतियों को पहचानना और टिक-टैक-टो खेलना। जब मॉडल को इस तरह की समस्याओं का सामना करना पड़ता है, तो यह अक्सर फर्जी जानकारी को “भ्रमित” कर देता है।

रॉयटर्स द्वारा साक्षात्कार किए गए एआई शोधकर्ता आम तौर पर इस बात पर सहमत हैं कि एआई के संदर्भ में तर्क में एक ऐसे मॉडल का निर्माण शामिल है जो एआई को आगे की योजना बनाने, भौतिक दुनिया के कामकाज को प्रतिबिंबित करने और चुनौतीपूर्ण बहु-चरणीय समस्याओं को विश्वसनीय तरीके से हल करने में सक्षम बनाता है।

एआई मॉडलों में तर्क-शक्ति में सुधार को, प्रमुख वैज्ञानिक खोजों से लेकर नए सॉफ्टवेयर अनुप्रयोगों की योजना बनाने और निर्माण करने तक, मॉडलों की क्षमता को अनलॉक करने की कुंजी के रूप में देखा जाता है।

ओपनएआई के सीईओ सैम ऑल्टमैन ने इस वर्ष की शुरुआत में कहा था कि एआई में “प्रगति के सबसे महत्वपूर्ण क्षेत्र तर्क क्षमता के आसपास होंगे।”

गूगल, मेटा और माइक्रोसॉफ्ट जैसी अन्य कंपनियां भी एआई मॉडल में तर्क को बेहतर बनाने के लिए विभिन्न तकनीकों के साथ प्रयोग कर रही हैं, जैसा कि एआई शोध करने वाली अधिकांश अकादमिक प्रयोगशालाएं कर रही हैं। हालांकि, शोधकर्ता इस बात पर अलग-अलग राय रखते हैं कि क्या बड़े भाषा मॉडल (एलएलएम) विचारों और दीर्घकालिक योजना को शामिल करने में सक्षम हैं कि वे कैसे भविष्यवाणी करते हैं। उदाहरण के लिए, आधुनिक एआई के अग्रदूतों में से एक, यान लेकुन, जो मेटा में काम करते हैं, ने अक्सर कहा है कि एलएलएम मानवीय तर्क करने में सक्षम नहीं हैं।

एआई चुनौतियां

मामले से परिचित सूत्र ने बताया कि स्ट्रॉबेरी उन चुनौतियों से पार पाने के लिए ओपनएआई की योजना का एक प्रमुख घटक है। रॉयटर्स द्वारा देखे गए दस्तावेज़ में बताया गया है कि स्ट्रॉबेरी का उद्देश्य क्या है, लेकिन यह नहीं बताया गया है कि कैसे।

हाल के महीनों में, कंपनी निजी तौर पर डेवलपर्स और अन्य बाहरी पक्षों को संकेत दे रही है कि वह काफी उन्नत तर्क क्षमताओं वाली तकनीक जारी करने की कगार पर है, ऐसा कंपनी की पिचों को सुनने वाले चार लोगों ने बताया। उन्होंने पहचान बताने से मना कर दिया क्योंकि वे निजी मामलों के बारे में बात करने के लिए अधिकृत नहीं हैं।

एक सूत्र ने बताया कि स्ट्रॉबेरी में ओपनएआई के जनरेटिव एआई मॉडल्स के लिए “पोस्ट-ट्रेनिंग” के रूप में जाना जाने वाला एक विशेष तरीका शामिल है, या सामान्यीकृत डेटा के ढेरों पर पहले से ही “प्रशिक्षण” दिए जाने के बाद बेस मॉडल्स को उनके प्रदर्शन को विशिष्ट तरीकों से सुधारने के लिए अनुकूलित करना शामिल है।

मॉडल विकसित करने के प्रशिक्षण के बाद के चरण में “फाइन-ट्यूनिंग” जैसी विधियां शामिल होती हैं, जो आज लगभग सभी भाषा मॉडलों पर उपयोग की जाने वाली एक प्रक्रिया है, जो कई रूपों में आती है, जैसे कि मनुष्यों द्वारा मॉडल को उसके प्रत्युत्तरों के आधार पर फीडबैक देना और उसे अच्छे और बुरे उत्तरों के उदाहरण देना।

मामले की जानकारी रखने वाले सूत्रों में से एक ने बताया कि स्ट्रॉबेरी की स्टैनफोर्ड में 2022 में विकसित की गई विधि “सेल्फ-टॉट रीज़नर” या “एसटीएआर” से समानता है। एसटीएआर एआई मॉडल को अपने स्वयं के प्रशिक्षण डेटा को पुनरावृत्त करके उच्च बुद्धिमत्ता स्तरों पर खुद को “बूटस्ट्रैप” करने में सक्षम बनाता है, और सिद्धांत रूप में इसका उपयोग भाषा मॉडल को मानव-स्तर की बुद्धिमत्ता से आगे बढ़ाने के लिए किया जा सकता है, इसके रचनाकारों में से एक, स्टैनफोर्ड के प्रोफेसर नोआ गुडमैन ने रॉयटर्स को बताया।

गुडमैन ने कहा, “मुझे लगता है कि यह रोमांचक और भयावह दोनों है… अगर चीजें इसी दिशा में चलती रहीं तो हमें इंसानों के तौर पर कुछ गंभीर बातों पर विचार करना होगा।” गुडमैन ओपनएआई से संबद्ध नहीं हैं और स्ट्रॉबेरी से परिचित नहीं हैं।

दस्तावेज़ में कहा गया है कि ओपनएआई स्ट्रॉबेरी को जिन क्षमताओं के लिए लक्ष्य कर रहा है, उनमें दीर्घकालिक कार्य (एलएचटी) करना भी शामिल है, जिसमें जटिल कार्यों का उल्लेख है, जिसके लिए मॉडल को आगे की योजना बनाने और लंबे समय तक कई कार्यों को करने की आवश्यकता होती है, जैसा कि पहले स्रोत ने बताया।

ऐसा करने के लिए, OpenAI उन मॉडलों का निर्माण, प्रशिक्षण और मूल्यांकन कर रहा है, जिन्हें कंपनी “गहन शोध” डेटासेट कहती है, OpenAI के आंतरिक दस्तावेज़ों के अनुसार। रॉयटर्स यह निर्धारित करने में असमर्थ था कि उस डेटासेट में क्या है या विस्तारित अवधि का क्या मतलब होगा।

दस्तावेज़ और एक स्रोत के अनुसार, OpenAI विशेष रूप से चाहता है कि उसके मॉडल इन क्षमताओं का उपयोग करके “CUA” या कंप्यूटर का उपयोग करने वाले एजेंट की सहायता से वेब को स्वायत्त रूप से ब्राउज़ करके शोध करें, जो इसके निष्कर्षों के आधार पर कार्रवाई कर सकता है। OpenAI सॉफ़्टवेयर और मशीन लर्निंग इंजीनियरों के काम करने पर अपनी क्षमताओं का परीक्षण करने की भी योजना बना रहा है।

Source link

Post Views: 42