Baidu ने कथित तौर पर बुधवार को एक नया आर्टिफिशियल इंटेलिजेंस (AI) वीडियो जेनरेशन मॉडल जारी किया। रिपोर्ट के अनुसार, Musestreamer AI मॉडल भी उत्पन्न वीडियो में चीनी ऑडियो को एकीकृत कर सकता है, जिससे यह Google के VEO 3 के बाद दूसरा ऐसा मॉडल बन जाता है। टेक दिग्गज का दावा है कि यह देशी चीनी ऑडियो पीढ़ी के समर्थन के साथ दुनिया का पहला AI मॉडल है। लार्ज लैंग्वेज मॉडल (एलएलएम) की शुरूआत के साथ -साथ, कंपनी ने कथित तौर पर एक नया वीडियो कंटेंट क्रिएशन प्लेटफॉर्म भी लॉन्च किया, जिसे हुइक्सियांग ने कहा। विशेष रूप से, न तो मुस्तमियर और न ही Huixiang वर्तमान में चीन के बाहर उपलब्ध है।
Baidu का मुस्त्रीमर कथित तौर पर चीनी ऑडियो उत्पन्न कर सकता है
एआई वीडियो जनरेशन मॉडल की दुनिया पिछले दो वर्षों में काफी विकसित हुई है। हम उन मॉडलों से चले गए हैं जो लोगों को एक निश्चित संख्या में उंगलियों के साथ एलएलएमएस में उत्पन्न करने के लिए संघर्ष करते हैं जो अब यथार्थवादी भौतिकी और गति को सटीक रूप से चित्रित कर सकते हैं। हालांकि, एक क्षेत्र के अधिकांश एआई खिलाड़ियों ने प्रवेश करने से परहेज किया है, जो उन वीडियो थे जो मूल रूप से ऑडियो का समर्थन करते थे।
Google I/O 2025 में, टेक दिग्गज VEO 3 के साथ इस क्षमता की पेशकश करने वाली पहली कंपनी बन गईं, जो तुरंत शहर की बात बन गई, अपने सबसे बड़े प्रतिद्वंद्वी, Openai के सोरा को पीछे छोड़ दिया। माउंटेन व्यू-आधारित टेक दिग्गज ने हाल ही में उन सभी 154 देशों में वीओ 3 का विस्तार किया, जहां मिथुन ऐप उपलब्ध है, इस टूल के लिए कंपनी के आक्रामक धक्का को उजागर करता है।
हालांकि, एशिया की रिपोर्ट (एआई बेस के माध्यम से) में एक तकनीक के अनुसार, चीनी टेक दिग्गज बैडू ने भी अपने मुस्तराया एआई मॉडल के साथ दौड़ में प्रवेश किया है। यह चीनी ऑडियो के साथ वीडियो उत्पन्न करने के लिए कहा जाता है, और ऐसा करने की क्षमता वाला एकमात्र मॉडल। विशेष रूप से, VEO 3 केवल अंग्रेजी भाषा में ऑडियो उत्पन्न कर सकता है।
Musestreamer कथित तौर पर न केवल वीडियो के साथ सिंक किए गए संवाद उत्पन्न कर सकता है, यह वीडियो में ध्वनि प्रभाव और परिवेशी शोर भी जोड़ सकता है। कहा जाता है कि Baidu ने दावा किया है कि मॉडल ने VBENCH I2V बेंचमार्क पर 89.38 प्रतिशत का स्कोर हासिल किया, शीर्ष पर रैंकिंग। टेक दिग्गज उपभोक्ताओं के लिए एक सामग्री निर्माण उपकरण के रूप में एलएलएम को पिच कर रहा है।
एआई मॉडल के साथ -साथ, Baidu ने कथित तौर पर एक नया वीडियो कंटेंट प्लेटफॉर्म भी लॉन्च किया है जिसे Huixiang डब किया गया है। Huixiang को AI मॉडल के लिए फ्रंट-एंड के रूप में सेवा करने के लिए कहा जाता है, जहां उपयोगकर्ता संकेत साझा कर सकते हैं और वीडियो उत्पन्न कर सकते हैं। रिपोर्ट में कहा गया है कि वर्तमान में मंच 1080p रिज़ॉल्यूशन पर 10-सेकंड लंबी वीडियो पीढ़ियों का समर्थन करता है। इसकी तुलना में, वीओ 3 केवल आठ-सेकंड-लंबे वीडियो उत्पन्न कर सकते हैं। वीडियो के डिफ़ॉल्ट पहलू अनुपात पर कोई स्पष्टता नहीं है, और यदि उपयोगकर्ता विभिन्न पहलू अनुपात में वीडियो उत्पन्न कर सकते हैं।