A.I

Google Releases Imagen 3 AI Image Generation Model to Users, Adds Improved Capabilities

Google ने छवि निर्माण के लिए अपना इन-हाउस कृत्रिम बुद्धिमत्ता (AI) मॉडल, Imagen 3, गुरुवार को जारी किया। टेक दिग्गज ने रिलीज़ के लिए कोई घोषणा नहीं की, और इसके बजाय चुपचाप उपयोगकर्ताओं के लिए मॉडल जारी कर दिया। इसके अतिरिक्त, छवि निर्माण मॉडल के कामकाज का विवरण देने वाला एक शोध पत्र भी एक ऑनलाइन जर्नल में प्रकाशित किया गया था। वर्तमान में, टेक्स्ट-टू-इमेज जेनरेशन मॉडल केवल यूएस में उपयोगकर्ताओं के लिए उपलब्ध है, और इस बारे में कोई जानकारी नहीं है कि इसे अन्य क्षेत्रों के उपयोगकर्ताओं के लिए कब पेश किया जाएगा।

Google द्वारा Imagen 3 AI मॉडल जारी किया गया

टेक दिग्गज का एआई टेस्ट किचन अब उपयोगकर्ताओं को प्लेटफॉर्म पर साइन अप करने और छवियां बनाने के लिए एआई मॉडल का उपयोग करने की अनुमति दे रहा है। कहा जाता है कि इसके इमेजेन मॉडल की तीसरी पीढ़ी में बेहतर बनावट निर्माण और शब्द पहचान क्षमताओं के साथ-साथ सख्त त्वरित पालन भी मिलता है।

चूँकि AI मॉडल केवल यूएस में उपलब्ध है, गैजेट्स 360 प्लेटफ़ॉर्म का परीक्षण करने में सक्षम नहीं था। हालाँकि, एक Reddit उपयोगकर्ता ने दावा किया कि वह Nikon DSLR गुणवत्ता, GoPro शैली, वाइड एंगल लेंस और बहुत कुछ जैसी विभिन्न शैलियों में छवियां उत्पन्न करने में सक्षम था। हालाँकि, कहा जाता है कि यह मॉडल कई लोगों और अंडरलाइट छवियों के साथ क्लोज़-अप छवियां बनाने में संघर्ष कर रहा है जो कि इसके पूर्ववर्ती के साथ संभव था।

एक अन्य क्षेत्र जहां इमेजन 3 संघर्ष करता है वह है अंग। उपयोगकर्ता ने दावा किया कि मॉडल “कॉफी का कप पकड़े हुए एक आदमी” जैसे संकेतों का उपयोग करते समय गलत परिणाम दे रहा था। एआई अंततः अतिरिक्त अंग उत्पन्न करेगा, वस्तु को पकड़ने वाला एक यादृच्छिक अंग बनाएगा, या वस्तु और अंग को जोड़ देगा। यह भी कहा जाता है कि छवि निर्माण मॉडल में संकेतों में बहुत सख्त सेंसरशिप होती है।

Google ने प्री-प्रिंट ऑनलाइन जर्नल arXiv में एक शोध पत्र भी प्रकाशित किया। वहां, कंपनी ने इस बात पर प्रकाश डाला कि उसने एक गुप्त प्रसार मॉडल का उपयोग किया है, जो स्टेबल डिफ्यूजन द्वारा लोकप्रिय प्रसार मॉडल का एक प्रकार है। कंपनी ने यह भी कहा कि इमेजन 3 मॉडल का उपयोग करके संभावित नुकसान को कम करने के लिए नए तरीकों का इस्तेमाल किया गया है।

विशेष रूप से, जेमिनी चैटबॉट का फ्री टियर भी छवियां उत्पन्न कर सकता है, लेकिन इसके लिए यह जेमिनी की क्षमताओं का उपयोग करता है। इमेजन 3 एक अलग वास्तुकला पर बनाया गया है और चूंकि इसके डेटासेट में बड़े पैमाने पर छवियां हैं, इसलिए इसे एआई छवियां उत्पन्न करने के लिए बेहतर प्रशिक्षित किया गया है।

Source link

Related Articles

Leave a Reply

Your email address will not be published. Required fields are marked *

Back to top button