OpenAI CTO Mira Murati Reveals AI Text-to-Video Generator Sora Will Be Available Later This Year: Report
एक रिपोर्ट के अनुसार, OpenAI इस साल के अंत में अपने नवीनतम जनरेटिव आर्टिफिशियल इंटेलिजेंस (AI) मॉडल सोरा को पेश करने की योजना बना रहा है। पिछले महीने पेश किया गया सोरा एक AI-संचालित टेक्स्ट-टू-वीडियो जनरेटर है, जिसके बारे में कंपनी का दावा है कि यह 60 सेकंड तक के वीडियो बना सकता है, जो इसके किसी भी उद्योग प्रतिद्वंद्वी से कहीं ज़्यादा लंबा है। हाल ही में एक साक्षात्कार में, AI फर्म के मुख्य तकनीकी अधिकारी ने यह भी खुलासा किया कि प्रॉम्प्ट की जटिलता के आधार पर सोरा कुछ ही मिनटों में वीडियो बना सकता है। साक्षात्कार में मॉडल की अपूर्णता, इसे प्रशिक्षित करने के लिए उपयोग किए जाने वाले डेटा और सोरा के संभावित मूल्य बिंदु जैसे विषयों को भी शामिल किया गया।
वॉल स्ट्रीट जर्नल के साथ एक साक्षात्कार में, ओपनएआई सीटीओ मीरा मुराती ने एआई वीडियो जनरेटर कब उपलब्ध होगा, इस सवाल पर कहा, “मुझे उम्मीद है कि यह इस साल उपलब्ध होगा, लेकिन इसमें कुछ महीने भी लग सकते हैं।” यह पूछे जाने पर कि क्या नवंबर 2024 में होने वाला अमेरिकी राष्ट्रपति चुनाव कंपनी के एआई मॉडल को कब जारी करने के बारे में विचार करने में कोई भूमिका निभाएगा, मुराती ने कहा कि गलत सूचना और हानिकारक पूर्वाग्रह से निपटना कंपनी के लिए महत्वपूर्ण है और उन्होंने कहा, “हम ऐसी कोई भी चीज़ जारी नहीं करेंगे जिसके बारे में हमें भरोसा न हो कि यह वैश्विक चुनावों को कैसे प्रभावित कर सकती है।”
मुराती से यह भी पूछा गया कि सोरा को किस डेटा स्रोत पर प्रशिक्षित किया गया था। यह सवाल इटली के डेटा सुरक्षा निगरानी संस्था के लिए भी दिलचस्पी का विषय है जो ओपनएआई द्वारा संभावित डेटा उल्लंघनों की जांच कर रही है। नियामकों ने एआई फर्म को एआई वीडियो जनरेटर के बारे में जानकारी देने के लिए 20 दिन का समय दिया।
साक्षात्कार में, मुराती ने भी कोई विवरण नहीं बताया और केवल इतना कहा कि एआई मॉडल को सार्वजनिक डोमेन में उपलब्ध डेटा पर प्रशिक्षित किया गया था और जिसे कंपनी को लाइसेंस दिया गया था। उन्होंने यह भी कहा कि उन्हें यकीन नहीं है कि YouTube या Facebook से डेटा का उपयोग किया गया था, लेकिन प्रकाशन से पुष्टि की कि सोरा ने शटरस्टॉक से सामग्री का उपयोग किया, जिसके साथ उनकी साझेदारी है।
मुराती ने बताया कि चैटजीपीटी और डीएएलएल-ई जैसे अन्य ओपनएआई टूल की तुलना में सोरा चलाना बहुत महंगा मॉडल है। सीटीओ ने डब्ल्यूएसजे को बताया, “चैटजीपीटी और डीएएलएल-ई को आम लोगों के इस्तेमाल के लिए अनुकूलित किया गया है, जबकि सोरा वास्तव में एक शोध आउटपुट है। यह बहुत, बहुत अधिक महंगा है।” हालांकि कंपनी ने एआई वीडियो मॉडल के लिए कोई मूल्य बिंदु तय नहीं किया है, मुराती ने कहा कि कंपनी मॉडल को उपलब्ध कराने की कोशिश कर रही है, एक बार जब यह जारी हो जाए, तो यह डीएएलएल-ई के समान कीमत पर उपलब्ध होगा। वर्तमान में, डीएएलएल-ई 3 मॉडल के लिए आधार मूल्य 1,024 x 1,024 पिक्सेल रिज़ॉल्यूशन में प्रति छवि $0.040 (लगभग 3 रुपये) है।
इसके अलावा, ओपनएआई के सीटीओ ने यह भी बताया कि कंपनी सोरा में ऑडियो क्षमताएं लाने, उत्पादन के समय और इसकी लागत-प्रभावशीलता को अनुकूलित करने और खामियों को कम करने के लिए और सुधार करने के लिए काम कर रही है।