Google DeepMind SynthID AI Watermarking Technology Open-Sourced to Businesses and Developers
Google DeepMind ने बुधवार को AI-जनरेटेड टेक्स्ट को वॉटरमार्क करने के लिए एक नई तकनीक ओपन-सोर्स की। डब किए गए सिंथआईडी, कृत्रिम बुद्धिमत्ता (एआई) वॉटरमार्किंग टूल का उपयोग टेक्स्ट, छवियों, वीडियो और ऑडियो सहित विभिन्न तौर-तरीकों में किया जा सकता है। हालाँकि, वर्तमान में, यह केवल व्यवसायों और डेवलपर्स को टेक्स्ट वॉटरमार्किंग टूल की पेशकश कर रहा है। कंपनी का लक्ष्य टूल को व्यापक रूप से अपनाना है ताकि एआई-जनित सामग्री का आसानी से पता लगाया जा सके। व्यक्ति और उद्यम माउंटेन व्यू-आधारित टेक दिग्गज के अपडेटेड रिस्पॉन्सिबल जेनरेटिव एआई टूलकिट के माध्यम से टूल तक पहुंच सकते हैं।
Google डीपमाइंड ओपन-सोर्स एआई टेक्स्ट वॉटरमार्किंग टेक्नोलॉजी
एक्स (जिसे पहले ट्विटर के नाम से जाना जाता था) पर एक पोस्ट में, Google डीपमाइंड के आधिकारिक हैंडल ने सिंथआईडी की टेक्स्ट वॉटरमार्किंग क्षमता को डेवलपर्स और व्यवसायों के लिए स्वतंत्र रूप से उपलब्ध कराने की घोषणा की। इसे रिस्पॉन्सिबल जेनएआई टूलकिट के अलावा गूगल की हगिंग फेस लिस्टिंग से भी डाउनलोड किया जा सकता है।
एआई-जनरेटेड टेक्स्ट ने पहले से ही इंटरनेट पर धूम मचाना शुरू कर दिया है। अमेज़ॅन वेब सर्विसेज एआई लैब ने इस साल की शुरुआत में एक अध्ययन प्रकाशित किया था जिसमें दावा किया गया था कि दो या दो से अधिक भाषाओं में अनुवादित किए गए सभी ऑनलाइन वाक्यों में से 57.1 प्रतिशत एआई टूल का उपयोग करके उत्पन्न किए जा सकते हैं।
जबकि एआई चैटबॉट इंटरनेट को अस्पष्ट एआई-जनरेटेड टेक्स्ट से भर देते हैं, यह हानिरहित स्पैमिंग का मामला प्रतीत हो सकता है, लेकिन इसका एक स्याह पक्ष भी है। बुरे अभिनेताओं के हाथों में, एआई टूल का उपयोग बड़े पैमाने पर गलत सूचना या भ्रामक सामग्री उत्पन्न करने के लिए किया जा सकता है। सामाजिक चर्चा का एक महत्वपूर्ण हिस्सा ऑनलाइन होने के कारण, इस तरह की कार्रवाइयां चुनाव जैसी वास्तविक जीवन की घटनाओं को प्रभावित कर सकती हैं और सार्वजनिक हस्तियों के खिलाफ प्रचार करने के लिए इसका इस्तेमाल किया जा सकता है।
सभी तौर-तरीकों में से, एआई-जनरेटेड टेक्स्ट का आकलन करना अब तक का सबसे कठिन काम साबित हुआ है। इसका मुख्य कारण यह है कि शब्दों को वॉटरमार्क करना संभव नहीं है, और यदि ऐसा था भी, तो बुरे अभिनेता हमेशा दूसरे आउटपुट चक्र का उपयोग करके सामग्री को दोबारा लिख सकते हैं।
हालाँकि, Google DeepMind का SynthID AI-जनरेटेड टेक्स्ट को वॉटरमार्क करने के लिए एक नए तरीके का उपयोग करता है। यह टूल उन शब्दों की भविष्यवाणी करने के लिए मशीन लर्निंग का उपयोग करता है जो किसी वाक्य में किसी विशिष्ट शब्द के बाद दिखाई दे सकते हैं। उदाहरण के लिए, इस वाक्य पर विचार करें “जॉन पूरे दिन काम करने के बाद बेहद थका हुआ महसूस कर रहा था।” यहां, “अत्यंत” शब्द के बाद केवल सीमित संख्या में शब्द ही आ सकते हैं।
विभिन्न एआई मॉडल की सामग्री निर्माण शैलियों के विश्लेषण के आधार पर, सिंथआईडी उस शब्द की भविष्यवाणी कर सकता है जो “बेहद” के बाद दिखाई देगा और इसे किसी अन्य पर्यायवाची से बदल देगा जो उसके डेटाबेस में मौजूद है। वॉटरमार्किंग टूल संपूर्ण सामग्री भाग में ऐसे शब्दों को एम्बेड करेगा। बाद में, जब टूल एआई-जनरेटेड सामग्री की जांच करता है, तो वह इसकी प्रामाणिकता निर्धारित करने के लिए ऐसे शब्दों की संख्या देखता है।
विशेष रूप से, छवियों और वीडियो के लिए, सिंथआईडी सीधे फ्रेम के पिक्सल में एक वॉटरमार्क जोड़ता है ताकि वे अदृश्य रहें लेकिन फिर भी टूल में पता लगाया जा सके। ऑडियो के लिए, ऑडियो तरंगों को पहले स्पेक्ट्रोग्राफ में परिवर्तित किया जाता है, और उस दृश्य डेटा में वॉटरमार्क जोड़ा जाता है। ये क्षमताएं वर्तमान में Google के बाहर किसी के लिए भी उपलब्ध नहीं हैं।