Stable Diffusion 3 Medium With Ability to Run Efficiently on Consumer Laptops Released by Stability AI
स्टेबिलिटी एआई ने बुधवार को अपने स्टेबल डिफ्यूजन 3 (एसडी3) आर्टिफिशियल इंटेलिजेंस (एआई) मॉडल का एक छोटा संस्करण जारी किया। स्टेबल डिफ्यूजन 3 मीडियम नाम से कंपनी ने छोटे टेक्स्ट-टू-इमेज मॉडल को अपने सबसे उन्नत इमेज जेनरेशन मॉडल के रूप में पेश किया। बड़े जनरेटिव एआई मॉडल की सभी कार्यक्षमता को बनाए रखते हुए, नवीनतम टूल में GPU की कम आवश्यकता होती है और पिछले मॉडल की तुलना में कम बिजली की खपत होती है। हगिंग फेस पर ओपन वेट भी उपलब्ध कराए गए हैं, और कंपनी का कहना है कि यह एआई मॉडल उपभोक्ता पीसी और लैपटॉप पर कुशलता से चल सकता है।
स्टेबिलिटी एआई ने स्टेबल डिफ्यूजन 3 मीडियम पेश किया
जबकि स्टेबल डिफ्यूजन 3 मॉडल (जिसे अब स्टेबल डिफ्यूजन 3 लार्ज कहा जा रहा है) अप्रैल में सार्वजनिक रूप से उपलब्ध हो गया था, इसकी उच्च GPU और कंप्यूट आवश्यकताओं ने उपभोक्ता-ग्रेड पीसी या लैपटॉप वाले अधिकांश लोगों के लिए इसे कुशलतापूर्वक चलाना मुश्किल बना दिया। कंपनी स्टेबल डिफ्यूजन 3 मीडियम की पेशकश करके इस समस्या का समाधान कर रही है, जो अधिकांश लैपटॉप और पीसी पर चल सकता है।
वेंचरबीट की एक रिपोर्ट के अनुसार, AI मॉडल के लिए न्यूनतम आवश्यकता 5GB GPU VRAM है और अनुशंसित आवश्यकता 16GB GPU VRAM है। विशेष रूप से, Nvidia GeForce RTX 3090 में 24GB GDDR6X VRAM है।
दो बिलियन पैरामीटर्स (एसडी3 लार्ज के आठ बिलियन पैरामीटर्स के विपरीत) के छोटे आकार के बावजूद, स्टेबिलिटी एआई ने न्यूज़रूम पोस्ट में कहा कि स्टेबल डिफ्यूजन 3 मीडियम अपने बड़े समकक्ष के समान दक्षता दिखाने में सक्षम होगा। नवीनतम इमेज जेनरेशन मॉडल विस्तृत फोटोरीलिस्टिक आउटपुट के साथ-साथ लचीली शैलियों में उच्च-गुणवत्ता वाले आउटपुट प्रदान करेगा। हाथों और चेहरों में यथार्थवाद को बेहतर बनाने के लिए, एआई फर्म 16-चैनल VAE (वैरिएशनल ऑटोएनकोडर) का उपयोग कर रही है।
प्रॉम्प्ट पालन भी बड़े मॉडल के समान स्तर पर होगा। SD3 मीडियम जटिल प्रॉम्प्ट को समझ सकता है जिसमें स्थानिक तर्क, रचना संबंधी तत्व, क्रियाएँ और शैलियाँ शामिल हैं। इसके अलावा, टाइपोग्राफी, जो छवि निर्माण मॉडल का एक आम दोष रहा है, को भी नवीनतम AI मॉडल में सुधारा गया है, कंपनी ने कहा।
स्टेबल डिफ्यूजन 3 मीडियम को कंपनी के फायरवर्क्स एआई-पावर्ड एपीआई (ऐप प्रोग्रामिंग इंटरफेस) के माध्यम से आम तौर पर उपलब्ध कराया गया है। टेक्स्ट-टू-इमेज एआई मॉडल को स्टेबल असिस्टेंट प्लेटफॉर्म या स्टेबल आर्टिसन डिस्कॉर्ड सर्वर के माध्यम से भी एक्सेस किया जा सकता है। हगिंग फेस पर नॉन-कमर्शियल लाइसेंस के साथ आगे के ओपन वेट भी उपलब्ध कराए गए हैं। इसे व्यावसायिक उद्देश्यों के लिए उपयोग करने के लिए, उपयोगकर्ताओं को कंपनी से क्रिएटर लाइसेंस प्राप्त करना होगा।
नवीनतम तकनीकी समाचारों और समीक्षाओं के लिए, गैजेट्स 360 को फ़ॉलो करें एक्सFacebook, WhatsApp, थ्रेड्स और Google News. गैजेट्स और तकनीक पर नवीनतम वीडियो के लिए, हमारे YouTube चैनल को सब्सक्राइब करें। यदि आप शीर्ष प्रभावशाली लोगों के बारे में सब कुछ जानना चाहते हैं, तो Instagram और YouTube पर हमारे इन-हाउस Who’sThat360 को फ़ॉलो करें।
सैमसंग गैलेक्सी वॉच 6 को वन यूआई 6 वॉच बीटा के साथ ये एआई-पावर्ड फीचर्स मिलते हैं
Realme GT 6 में 50-मेगापिक्सेल Sony LYT-808 मुख्य कैमरा मिलने की पुष्टि हुई