Stable Diffusion 3 Medium With Ability to Run Efficiently on Consumer Laptops Released by Stability AI
स्टेबिलिटी एआई ने बुधवार को अपने स्टेबल डिफ्यूजन 3 (एसडी3) आर्टिफिशियल इंटेलिजेंस (एआई) मॉडल का एक छोटा संस्करण जारी किया। स्टेबल डिफ्यूजन 3 मीडियम नाम से कंपनी ने छोटे टेक्स्ट-टू-इमेज मॉडल को अपने सबसे उन्नत इमेज जेनरेशन मॉडल के रूप में पेश किया। बड़े जेनरेटर एआई मॉडल की सभी कार्यक्षमता को बरकरार रखते हुए, नवीनतम टूल में जीपीयू आवश्यकताएं कम हैं और पिछले मॉडल की तुलना में कम बिजली की खपत होती है। हगिंग फेस पर ओपन वेट भी उपलब्ध कराया गया है और कंपनी का कहना है कि यह एआई मॉडल उपभोक्ता पीसी और लैपटॉप पर कुशलतापूर्वक चल सकता है।
स्टेबिलिटी एआई ने स्टेबल डिफ्यूजन 3 मीडियम पेश किया
जबकि स्टेबल डिफ्यूजन 3 मॉडल (जिसे अब स्टेबल डिफ्यूजन 3 लार्ज कहा जा रहा है) अप्रैल में सार्वजनिक रूप से उपलब्ध हो गया, इसकी उच्च जीपीयू और गणना आवश्यकताओं ने उपभोक्ता-ग्रेड पीसी या लैपटॉप वाले अधिकांश लोगों के लिए इसे कुशलतापूर्वक चलाना मुश्किल बना दिया। कंपनी स्टेबल डिफ्यूजन 3 मीडियम की पेशकश करके इस समस्या का समाधान कर रही है, जो अधिकांश लैपटॉप और पीसी पर चल सकता है।
वेंचरबीट की एक रिपोर्ट के अनुसार, AI मॉडल के लिए न्यूनतम आवश्यकता 5GB GPU VRAM है और अनुशंसित आवश्यकता 16GB GPU VRAM है। विशेष रूप से, Nvidia GeForce RTX 3090 में 24GB GDDR6X VRAM है।
दो अरब मापदंडों के छोटे आकार (एसडी3 लार्ज के आठ अरब मापदंडों के विपरीत) के बावजूद, स्टेबिलिटी एआई ने एक न्यूजरूम पोस्ट में कहा कि स्टेबल डिफ्यूजन 3 मीडियम अपने बड़े समकक्ष के समान स्तर की दक्षता दिखाने में सक्षम होगा। नवीनतम छवि निर्माण मॉडल विस्तृत फोटोयथार्थवादी आउटपुट के साथ-साथ लचीली शैलियों में उच्च गुणवत्ता वाले आउटपुट प्रदान करेगा। हाथों और चेहरों में यथार्थवाद को बेहतर बनाने के लिए, एआई फर्म 16-चैनल वीएई (वेरिएशनल ऑटोएनकोडर) का उपयोग कर रही है।
शीघ्र अनुपालन भी बड़े मॉडल के समान स्तर पर होगा। SD3 मीडियम जटिल संकेतों को समझ सकता है जिसमें स्थानिक तर्क, संरचनागत तत्व, क्रियाएं और शैलियाँ शामिल हैं। इसके अलावा, टाइपोग्राफी, जो छवि निर्माण मॉडल का एक आम नुकसान रही है, को भी नवीनतम एआई मॉडल में सुधार किया गया है, कंपनी ने कहा।
स्टेबल डिफ्यूजन 3 मीडियम को कंपनी के फायरवर्क्स एआई-संचालित एपीआई (ऐप प्रोग्रामिंग इंटरफेस) के माध्यम से आम तौर पर उपलब्ध कराया गया है। टेक्स्ट-टू-इमेज एआई मॉडल को स्टेबल असिस्टेंट प्लेटफॉर्म या स्टेबल आर्टिसन डिस्कॉर्ड सर्वर के माध्यम से भी एक्सेस किया जा सकता है। इसके अलावा हगिंग फेस पर गैर-व्यावसायिक लाइसेंस के साथ खुले वजन भी उपलब्ध कराए गए हैं। इसे व्यावसायिक उद्देश्यों के लिए इस्तेमाल करने के लिए यूजर्स को कंपनी से क्रिएटर लाइसेंस लेना होगा।
नवीनतम तकनीकी समाचारों और समीक्षाओं के लिए गैजेट्स 360 को फ़ॉलो करें एक्सफेसबुक, व्हाट्सएप, थ्रेड्स और गूगल न्यूज। गैजेट और तकनीक पर नवीनतम वीडियो के लिए, हमारे YouTube चैनल की सदस्यता लें। यदि आप शीर्ष प्रभावशाली व्यक्तियों के बारे में सब कुछ जानना चाहते हैं, तो इंस्टाग्राम और यूट्यूब पर हमारे इन-हाउस Who’sThat360 को फ़ॉलो करें।
सैमसंग गैलेक्सी वॉच 6 में वन यूआई 6 वॉच बीटा के साथ ये एआई-पावर्ड फीचर्स मिलते हैं
Realme GT 6 में 50-मेगापिक्सल Sony LYT-808 मुख्य कैमरा मिलने की पुष्टि हुई है