Higgsfield AI Introduces Diffuse App, an Image-to-Video Generator for Smartphones
वीडियो AI कंपनी हिग्सफील्ड AI ने स्मार्टफ़ोन के लिए अपना पहला आर्टिफ़िशियल इंटेलिजेंस (AI)-संचालित ऐप लॉन्च किया है। डिफ़्यूज़ नाम का यह मोबाइल-फ़र्स्ट ऐप एक इमेज-टू-वीडियो जनरेटर है जो सेल्फी का इस्तेमाल करके उसे कैरेक्टर वाले वीडियो में बदल सकता है। कंपनी का दावा है कि यह जो कैरेक्टर बनाता है, वह जीवंत गति के साथ आता है। ऐप को धीरे-धीरे चुनिंदा बाज़ारों में रोल आउट किया जा रहा है और उपयोगकर्ता इसे Android और iOS दोनों पर पा सकेंगे। यह AI टूल संभवतः OpenAI के सोरा से प्रतिस्पर्धा करेगा, जिसे इस साल के अंत में लॉन्च किए जाने की खबर है।
कंपनी का आधिकारिक खाता लिया एक्स (जिसे पहले ट्विटर के नाम से जाना जाता था) को यह घोषणा करने के लिए कहा गया। हिग्सफील्ड एआई ने खुद को एक वीडियो एआई कंपनी के रूप में पेश किया, जो सोशल मीडिया के लिए वीडियो सामग्री बनाने पर केंद्रित है। यह विज़न संभवतः एआई फर्म के सीईओ एलेक्स मशराबोव से आया है, जो पहले स्नैप में जनरेटिव एआई डिवीजन का नेतृत्व कर रहे थे। पोस्ट के अनुसार, कंपनी अपने उपकरणों के लिए एक आधारभूत मॉडल का निर्माण कर रही है जो पूरी तरह से वीडियो-केंद्रित होगा।
हम डिफ्यूज़ भी पेश कर रहे हैं – मोबाइल पर हमारे वीडियो मॉडल का पूर्वावलोकन करने का एक मजेदार तरीका।
सामग्री लाइब्रेरी से एक वीडियो चुनें, अपनी सेल्फी चुनें और डिफ्यूज़ उस वीडियो की शैली में एक व्यक्तिगत चरित्र तैयार कर देगा।
या वीडियो बनाने के लिए प्रॉम्प्ट बिल्डर का उपयोग करें… pic.twitter.com/lN7azXycsN
— हिग्सफील्ड एआई (@higgsfield_ai) 3 अप्रैल, 2024
एक अलग डाककंपनी ने डिफ्यूज भी पेश किया, जो कंपनी द्वारा बनाया गया पहला मोबाइल ऐप है, जो वर्तमान में पूर्वावलोकन मोड में उपलब्ध है। “कंटेंट लाइब्रेरी से एक वीडियो चुनें, अपनी सेल्फी चुनें और डिफ्यूज उस वीडियो की शैली में एक व्यक्तिगत चरित्र तैयार करेगा। या टेक्स्ट, इमेज या वीडियो का उपयोग करके स्क्रैच से वीडियो बनाने के लिए प्रॉम्प्ट बिल्डर का उपयोग करें। डिफ्यूज व्यक्तिगतकरण, रचनात्मक नियंत्रण और फाइन-ट्यूनिंग का एक गहरा स्तर प्रदान करता है ताकि कोई भी व्यक्ति ठीक वही बना सके जो वह चाहता है (निश्चित रूप से सुरक्षा उपायों के साथ), “पोस्ट ने कहा। ऐप वर्तमान में चुनिंदा बाजारों में उपलब्ध है जिसमें भारत, दक्षिण अफ्रीका, फिलीपींस, कनाडा और मध्य एशिया के देश शामिल हैं।
हम ऐप स्टोर में ऐप ढूँढ़ने में सफल रहे, लेकिन यह एंड्रॉइड प्ले स्टोर पर नहीं दिखा। यह अगले कुछ दिनों में बदल सकता है क्योंकि कंपनी धीरे-धीरे ऐप को रोल आउट कर रही है। ऐप वर्तमान में 2 सेकंड का वीडियो जनरेशन प्रदान करता है क्योंकि यह पूर्वावलोकन मोड में है। AI फर्म का कहना है कि इसका अंतिम लक्ष्य मोबाइल डिवाइस पर यथार्थवादी, विस्तृत और तरल वीडियो प्राप्त करना है।
इसके लिए, यह अपने आधारभूत मॉडल को खरोंच से बना रहा है। वीडियो मॉडल ट्रांसफॉर्मर आर्किटेक्चर का उपयोग करता है, जिसका उपयोग OpenAI के ChatGPT द्वारा भी किया जाता है। हिग्सफील्ड AI ने आगे बताया कि यह इन-हाउस विकसित किए गए मालिकाना ढांचे के कारण सीमित GPU पर अपने AI मॉडल को कुशलतापूर्वक प्रशिक्षित करने में सक्षम था। कंपनी ने यह नहीं बताया है कि वह ऐप का पूर्ण संस्करण सार्वजनिक रूप से कब जारी कर सकती है।