Odyssey Building ‘Hollywood-Grade’ AI Text-to-Video Model to Compete With Sora, Gen-3 Alpha
पिछले साल स्थापित एक कृत्रिम बुद्धिमत्ता (एआई) स्टार्टअप ओडिसी ने सोमवार को अपने पहले एआई उत्पाद के बारे में विवरण साझा किया। फर्म ने खुलासा किया कि वह एक एआई वीडियो मॉडल बना रही है जो ओपनएआई के सोरा टूल की तरह हॉलीवुड-ग्रेड दृश्य प्रभाव पैदा कर सकता है जिसे कंपनी द्वारा अभी तक जारी नहीं किया गया है। ओडिसी के सह-संस्थापक का कहना है कि एआई मॉडल उपयोगकर्ताओं को आउटपुट को बारीक स्तर पर संपादित और नियंत्रित करने देगा, उन्होंने कहा कि कंपनी आउटपुट वीडियो की विभिन्न परतों को उत्पन्न करने के लिए कई बड़े भाषा मॉडल (एलएलएम) के साथ काम कर रही है, जिसे अलग से नियंत्रित किया जा सकता है। .
ओडिसी का एआई विज़ुअल मॉडल कैसे काम करता है
एक्स (पूर्व में ट्विटर) पर पोस्ट की एक श्रृंखला में ओडिसी के सीईओ और सह-संस्थापक ओलिवर कैमरन ने कहा कि एआई स्टार्टअप ने Google वेंचर्स के नेतृत्व में अपने सीड राउंड फंडिंग में $ 9 मिलियन (लगभग 75.1 करोड़ रुपये) जुटाए थे और वर्तमान में एक टूल का निर्माण कर रहा था। यह उच्च-गुणवत्ता वाला वीडियो प्रदान करेगा जिसे उपयोगकर्ताओं द्वारा अनुकूलित और संपादित किया जा सकता है।
कैमरन ने ओडिसी की एआई तकनीक के बारे में भी विवरण साझा किया और दावा किया कि इसे “हॉलीवुड-ग्रेड” वीडियो बनाने के लिए डिज़ाइन किया गया था। कार्यकारी ने यह भी कहा कि स्टार्टअप “दृश्य कहानी कहने की मुख्य परतों का पूर्ण नियंत्रण” लेने के लिए उपयोगकर्ताओं को चार जेनरेटिव मॉडल का प्रशिक्षण दे रहा था।
व्यक्तिगत रूप से, प्रत्येक मॉडल आपको अपने दृश्य की बारीकियों को सटीक रूप से कॉन्फ़िगर करने में सक्षम करेगा।
संयुक्त रूप से, ये मॉडल वीडियो या दृश्य उत्पन्न करेंगे, लेकिन बिल्कुल वैसे ही जैसे आप चाहते थे।
आगे बढ़ते हुए, हमारे मॉडल आउटपुट हॉलीवुड और उसके बाहर उपयोग में आने वाली मौजूदा पाइपलाइनों में एकीकृत हो जाते हैं। pic.twitter.com/jHZoevLV9n
– ओलिवर कैमरून (@olivercameron) 8 जुलाई 2024
कैमरन ने मौजूदा एआई टेक्स्ट-टू-वीडियो मॉडल में समस्या पर प्रकाश डाला, जो आउटपुट को नियंत्रित करने या संपादित करने के लिए टूल या विकल्पों की कमी है। “एक कहानीकार के रूप में, आपके पास अपने परिवेश या पात्रों को निर्देशित करने, या अपने शॉट के बारीक विवरणों को तब तक दोहराने की क्षमता नहीं है जब तक कि यह बिल्कुल सही न हो जाए। अधिक शक्तिशाली मॉडलों की आवश्यकता है,” उन्होंने कहा।
समस्या को हल करने के लिए, कंपनी कई एआई मॉडल का उपयोग कर रही है जो समग्र वीडियो की एक परत उत्पन्न करेगी। कैमरून के अनुसार, चार मॉडल स्वतंत्र रूप से ज्यामिति, सामग्री, प्रकाश और गति उत्पन्न करेंगे। इन चार परतों को एक ही टेक्स्ट प्रॉम्प्ट के आधार पर एक साथ तैयार किया जाएगा और फिर अंतिम वीडियो प्रस्तुत करने के लिए संयोजित किया जाएगा।
कंपनी का दावा है कि उपयोगकर्ताओं के पास आउटपुट पर अधिक नियंत्रण के लिए प्रत्येक परत को अलग से कॉन्फ़िगर करने का विकल्प होगा। ओडिसी अपने वीडियो आउटपुट को दृश्य प्रभाव उत्पन्न करने के लिए उपयोग किए जाने वाले मौजूदा हॉलीवुड टूल और सिस्टम में भी एकीकृत करेगा।
वर्तमान में, AI वीडियो मॉडल अपने प्रारंभिक विकास चरण में है। एआई मॉडल के लिए कोई लॉन्च तिथि नहीं है। हालाँकि, कंपनी ने इस बात पर प्रकाश डाला है कि वह अपनी प्रगति के बारे में नियमित अपडेट साझा करती रहेगी। विशेष रूप से, कैमरून पहले सेल्फ-ड्राइविंग वाहनों के साथ काम करने वाले दो स्टार्टअप क्रूज़ और वॉयेज के लिए काम कर चुके हैं।
कंपनी के दूसरे सह-संस्थापक और सीटीओ जेफ हॉक पहले वेवे में प्रौद्योगिकी के उपाध्यक्ष के रूप में काम कर रहे थे, जो एक एआई फर्म है जो स्वायत्त ड्राइविंग सिस्टम विकसित कर रही है।