Google Releases Imagen 3 AI Image Generation Model to Users, Adds Improved Capabilities
Google ने छवि निर्माण के लिए अपना इन-हाउस कृत्रिम बुद्धिमत्ता (AI) मॉडल, Imagen 3, गुरुवार को जारी किया। टेक दिग्गज ने रिलीज़ के लिए कोई घोषणा नहीं की, और इसके बजाय चुपचाप उपयोगकर्ताओं के लिए मॉडल जारी कर दिया। इसके अतिरिक्त, छवि निर्माण मॉडल के कामकाज का विवरण देने वाला एक शोध पत्र भी एक ऑनलाइन जर्नल में प्रकाशित किया गया था। वर्तमान में, टेक्स्ट-टू-इमेज जेनरेशन मॉडल केवल यूएस में उपयोगकर्ताओं के लिए उपलब्ध है, और इस बारे में कोई जानकारी नहीं है कि इसे अन्य क्षेत्रों के उपयोगकर्ताओं के लिए कब पेश किया जाएगा।
Google द्वारा Imagen 3 AI मॉडल जारी किया गया
टेक दिग्गज का एआई टेस्ट किचन अब उपयोगकर्ताओं को प्लेटफॉर्म पर साइन अप करने और छवियां बनाने के लिए एआई मॉडल का उपयोग करने की अनुमति दे रहा है। कहा जाता है कि इसके इमेजेन मॉडल की तीसरी पीढ़ी में बेहतर बनावट निर्माण और शब्द पहचान क्षमताओं के साथ-साथ सख्त त्वरित पालन भी मिलता है।
चूँकि AI मॉडल केवल यूएस में उपलब्ध है, गैजेट्स 360 प्लेटफ़ॉर्म का परीक्षण करने में सक्षम नहीं था। हालाँकि, एक Reddit उपयोगकर्ता ने दावा किया कि वह Nikon DSLR गुणवत्ता, GoPro शैली, वाइड एंगल लेंस और बहुत कुछ जैसी विभिन्न शैलियों में छवियां उत्पन्न करने में सक्षम था। हालाँकि, कहा जाता है कि यह मॉडल कई लोगों और अंडरलाइट छवियों के साथ क्लोज़-अप छवियां बनाने में संघर्ष कर रहा है जो कि इसके पूर्ववर्ती के साथ संभव था।
एक अन्य क्षेत्र जहां इमेजन 3 संघर्ष करता है वह है अंग। उपयोगकर्ता ने दावा किया कि मॉडल “कॉफी का कप पकड़े हुए एक आदमी” जैसे संकेतों का उपयोग करते समय गलत परिणाम दे रहा था। एआई अंततः अतिरिक्त अंग उत्पन्न करेगा, वस्तु को पकड़ने वाला एक यादृच्छिक अंग बनाएगा, या वस्तु और अंग को जोड़ देगा। यह भी कहा जाता है कि छवि निर्माण मॉडल में संकेतों में बहुत सख्त सेंसरशिप होती है।
Google ने प्री-प्रिंट ऑनलाइन जर्नल arXiv में एक शोध पत्र भी प्रकाशित किया। वहां, कंपनी ने इस बात पर प्रकाश डाला कि उसने एक गुप्त प्रसार मॉडल का उपयोग किया है, जो स्टेबल डिफ्यूजन द्वारा लोकप्रिय प्रसार मॉडल का एक प्रकार है। कंपनी ने यह भी कहा कि इमेजन 3 मॉडल का उपयोग करके संभावित नुकसान को कम करने के लिए नए तरीकों का इस्तेमाल किया गया है।
विशेष रूप से, जेमिनी चैटबॉट का फ्री टियर भी छवियां उत्पन्न कर सकता है, लेकिन इसके लिए यह जेमिनी की क्षमताओं का उपयोग करता है। इमेजन 3 एक अलग वास्तुकला पर बनाया गया है और चूंकि इसके डेटासेट में बड़े पैमाने पर छवियां हैं, इसलिए इसे एआई छवियां उत्पन्न करने के लिए बेहतर प्रशिक्षित किया गया है।