Google I/O 2024: Text-to-Image AI Model Imagen 3 Unveiled, Gets Improved Image Generation Capabilities
Google ने अपने वार्षिक डेवलपर-केंद्रित Google I/O 2024 इवेंट में कई नई घोषणाएँ कीं। मुख्य सत्र के दौरान की गई कई आर्टिफिशियल इंटेलिजेंस (AI) केंद्रित घोषणाओं में से एक विशेष रूप से आश्चर्यजनक थी। टेक दिग्गज ने अपने टेक्स्ट-टू-इमेज AI मॉडल, इमेजन 3 की अगली पीढ़ी को पेश किया। नया AI मॉडल अपने पूर्ववर्ती इमेजन 2 के लॉन्च के कुछ ही महीनों बाद पेश किया गया था, जो दिसंबर 2023 में आया था और बाद में पिछले महीने अपग्रेड किया गया था। कंपनी ने कहा कि नया मॉडल प्रॉम्प्ट का बारीकी से पालन करते हुए विस्तृत फोटोरीलिस्टिक इमेज तैयार कर सकता है।
इमेजन 3 को गूगल डीपमाइंड के सीनियर रिसर्च डायरेक्टर डगलस एक ने पेश किया। इसका अनावरण करते हुए उन्होंने कहा, “आज, मैं इमेजन 3 को पेश करते हुए बहुत उत्साहित हूँ। यह हमारा अब तक का सबसे सक्षम इमेज जेनरेशन मॉडल है। यह लोगों द्वारा लिखे गए संकेतों को उसी तरह समझता है जिस तरह से लोग लिखते हैं। आप जितने रचनात्मक और विस्तृत होंगे, उतना ही बेहतर होगा। साथ ही, यह टेक्स्ट रेंडर करने के लिए हमारा अब तक का सबसे अच्छा मॉडल है जो इमेज जेनरेशन मॉडल के लिए एक चुनौती रहा है।”
कहा जाता है कि AI मॉडल की संकेतों को समझने की क्षमता में काफ़ी सुधार हुआ है, जो अब इसे छोटे विवरणों को पकड़ने और एक विश्वसनीय छवि बनाने के लिए संकेत का बारीकी से पालन करने की अनुमति देता है। यह घटना के दौरान AI से संबंधित अधिकांश घोषणाओं के लिए एक सामान्य दिशा भी प्रतीत होती है, क्योंकि अधिकांश AI मॉडल अब संकेतों को बेहतर ढंग से समझने में सक्षम हैं। Google ने कहा कि Imagen 3 कई संस्करणों में उपलब्ध होगा जहाँ प्रत्येक मॉडल को एक विशिष्ट प्रकार के कार्य के लिए अनुकूलित किया जाता है जो त्वरित रेखाचित्र बनाने से लेकर उच्च-रिज़ॉल्यूशन वाली छवियाँ बनाने तक हो सकता है।
इमेजन 3 को कैमरा एंगल या कंपोजिशन जैसे छोटे विवरणों और विशिष्ट निर्देशों को लंबे, जटिल संकेतों में कैप्चर करने में सक्षम बनाने के लिए, Google ने AI मॉडल को उन छवियों के साथ प्रशिक्षित किया है जिनके कैप्शन में विस्तृत विवरण हैं, जिससे यह छोटी बारीकियों को भी समझ सकता है। यह विभिन्न प्रकार की बनावट भी उत्पन्न कर सकता है और टेक्स्ट-आधारित छवियों को प्रस्तुत कर सकता है।
सुरक्षा पर ध्यान केंद्रित करते हुए, इमेजन 3 द्वारा बनाई गई प्रत्येक छवि में सिंथआईडी का वॉटरमार्क लेबलिंग शामिल होगा। यह छवि के पिक्सल में सीधे एक डिजिटल वॉटरमार्क एम्बेड करता है, जिससे इसे क्रॉप करके, शेयर करके या छवि में कोई भी बदलाव करके हटाना असंभव हो जाता है। आने वाले महीनों में AI मॉडल के सार्वजनिक पूर्वावलोकन में आने की उम्मीद है। अभी, Google इनपेंटिंग और आउटपेंटिंग संपादन विकल्पों को जोड़ने पर काम कर रहा है। इमेजन 3 वर्तमान में चुनिंदा क्रिएटर्स के लिए इमेजएफएक्स के अंदर निजी पूर्वावलोकन में उपलब्ध है। इसे जल्द ही टेक दिग्गज के एंटरप्राइज़ ग्राहकों के लिए उपलब्ध कराया जाएगा।
नवीनतम तकनीकी समाचारों और समीक्षाओं के लिए, गैजेट्स 360 को फ़ॉलो करें एक्सFacebook, WhatsApp, थ्रेड्स और Google News. गैजेट्स और तकनीक पर नवीनतम वीडियो के लिए, हमारे YouTube चैनल को सब्सक्राइब करें। यदि आप शीर्ष प्रभावशाली लोगों के बारे में सब कुछ जानना चाहते हैं, तो Instagram और YouTube पर हमारे इन-हाउस Who’sThat360 को फ़ॉलो करें।
Redmi K70 Ultra को 3C सर्टिफिकेशन साइट पर देखा गया; मीडियाटेक डाइमेंशन 9300+ SoC मिलने की उम्मीद