Google Launches AI Image Generation Model Imagen 3 and Video Model Veo
Google ने आखिरकार बुधवार को अपना नवीनतम कृत्रिम बुद्धिमत्ता (AI) छवि और वीडियो पीढ़ी मॉडल लॉन्च किया। इन दोनों AI मॉडलों का अनावरण Google I/O में तकनीकी दिग्गज की जेनरेटिव AI में नवीनतम प्रगति के रूप में किया गया था। अब, छह महीने से अधिक समय के बाद, माउंटेन व्यू-आधारित कंपनी ने इसे अपने एंटरप्राइज़ ग्राहकों के लिए वर्टेक्स एआई पर पेश किया है। विशेष रूप से, जबकि इमेजन 3 अब तक एक स्टैंडअलोन प्लेटफ़ॉर्म के रूप में उपलब्ध नहीं था, इसका उपयोग कई प्लेटफ़ॉर्म और टूल जैसे Google डॉक्स, जेमिनी और जेनचेस नामक एक प्रायोगिक टूल में किया जा रहा था।
Google Imagen 3, Veo AI मॉडल
एक ब्लॉग पोस्ट में, टेक दिग्गज ने वर्टेक्स एआई में दो नए एआई मॉडल पेश करने की घोषणा की। Google का वर्टेक्स AI प्लेटफ़ॉर्म Google क्लाउड पर एक प्रबंधित मशीन लर्निंग (ML) प्लेटफ़ॉर्म है जो डेवलपर्स और उद्यमों को AI मॉडल बनाने, तैनात करने और प्रबंधित करने की अनुमति देता है। यह अमेज़ॅन बेडरॉक और माइक्रोसॉफ्ट एज़्योर के समान है और एआई वर्कफ़्लो के लिए एकीकृत उपकरण और समाधान प्रदान करता है।
टेक दिग्गज ने कहा कि वीओ वीडियो जेनरेशन मॉडल अब निजी पूर्वावलोकन में वर्टेक्स एआई पर उपलब्ध है और व्यवसाय टेक्स्ट या छवि संकेतों का उपयोग करके वीडियो तैयार कर सकते हैं। दूसरी ओर, इमेजेन 3 अगले सप्ताह से उपलब्ध कराया जाएगा। यह टेक्स्ट संकेत लेता है और उद्यम इसका उपयोग ऐसी छवियां उत्पन्न करने के लिए कर सकते हैं जो उनकी ब्रांड शैली और लोगो को प्रतिबिंबित करती हैं।
Veo की क्षमताओं की बात करें तो, Google का कहना है कि यह टेक्स्ट या छवि संकेतों के आधार पर उच्च गुणवत्ता वाले वीडियो उत्पन्न कर सकता है। जेनरेट किए गए वीडियो सिनेमाई और दृश्य शैलियों की एक विस्तृत श्रृंखला में हो सकते हैं। डीपमाइंड द्वारा विकसित, एआई मॉडल के बारे में कहा जाता है कि इसमें उच्च त्वरित अनुपालन होता है और यह वस्तुओं और लोगों के लगातार फुटेज उत्पन्न कर सकता है और यहां तक कि वास्तविक रूप से गतिविधियों को भी पकड़ सकता है।
इमेजेन 3, जो अगले सप्ताह से वर्टेक्स एआई में उपलब्ध होगा, शैलियों की एक विस्तृत श्रृंखला में फोटोरिअलिस्टिक छवियां उत्पन्न कर सकता है। इसे “हमारा अब तक का सबसे सक्षम छवि निर्माण मॉडल” कहते हुए, Google ने कहा कि छवि निर्माण मॉडल प्राकृतिक भाषा के संकेतों को समझ सकता है और उपयोगकर्ताओं को वांछित परिणाम प्राप्त करने के लिए तकनीकी तत्वों का वर्णन करने की आवश्यकता नहीं है।
इमेजन 3 एआई मॉडल इनपेंटिंग और आउटपेंटिंग के लिए संपादन टूल के साथ भी उपलब्ध होगा। कंपनियाँ उत्पन्न छवियों में अपने ब्रांड के रंग, शैली, लोगो और अन्य तत्व भी डाल सकती हैं।
गोपनीयता और सुरक्षा के लिए, टेक दिग्गज ने कई टूल जोड़े हैं। सिंथआईडी, डीपमाइंड द्वारा विकसित वॉटरमार्किंग तकनीक, वीडियो की हर छवि और फ्रेम में एम्बेड की जाएगी, जिसे ये एआई मॉडल डीपफेक और गलत सूचना की घटनाओं से निपटने के लिए तैयार करेंगे। Google ने यह भी कहा कि AI मॉडल को ग्राहक डेटा पर प्रशिक्षित नहीं किया जाएगा और उपकरण Google क्लाउड के डेटा प्रशासन और गोपनीयता नियंत्रण के बाद काम करेंगे।