A.I

Google DeepMind to Use SynthID to Watermark Gemini and Veo’s AI-Generated Content

Biplab Das August 18, 2024

0 22 2 minutes read

Google ने मंगलवार देर रात अपने I/O 2024 मुख्य सत्र के दौरान कृत्रिम बुद्धिमत्ता (AI)-आधारित कई घोषणाएँ कीं। इनमें नए AI मॉडल, मौजूदा फाउंडेशन मॉडल में अपग्रेड, Google के उत्पादों में AI सुविधाओं का एकीकरण, और बहुत कुछ शामिल हैं। तकनीकी दिग्गज ने AI सुरक्षा पर भी ध्यान केंद्रित किया और AI-जनरेटेड कंटेंट के लिए अपनी मूल वॉटरमार्किंग तकनीक के उपयोग का विस्तार किया, जिसे SynthID कहा जाता है। यह नया टूलकिट अब Gemini ऐप और वेब क्लाइंट द्वारा जेनरेट किए गए टेक्स्ट और Veo द्वारा जेनरेट किए गए वीडियो के लिए वॉटरमार्क एम्बेड करेगा।

सिंथआईडी को सबसे पहले अगस्त 2023 में Google DeepMind द्वारा एक बीटा प्रोजेक्ट के रूप में पेश किया गया था, जिसका उद्देश्य AI-जनरेटेड कंटेंट को सही ढंग से लेबल करना था। ऐसे समाधान की आवश्यकता उन उदाहरणों के बढ़ने के कारण महसूस की गई थी जहाँ इन कृत्रिम रूप से बनाए गए मीडिया को वास्तविक के रूप में साझा किया गया था। इनका उपयोग गलत सूचना और फ़िशिंग जैसे साइबर अपराधों को फैलाने के लिए किया गया था। टेक दिग्गज ने पहली बार नवंबर 2023 में इस तकनीक का इस्तेमाल किया था, जब इसका इस्तेमाल अपने लाइरिया मॉडल के माध्यम से बनाए गए AI-जनरेटेड ऑडियो को वॉटरमार्क करने के लिए किया गया था। टूलकिट ने ऑडियो में तरंग के रूप में वॉटरमार्क जोड़े ताकि इसे अगोचर लेकिन पता लगाने योग्य बनाया जा सके।

अब, Google टेक्स्ट और वीडियो जनरेशन को शामिल करने के लिए सिंथआईडी के उपयोग का विस्तार कर रहा है। यह अब जेमिनी ऐप और वेबसाइट का उपयोग करके उत्पन्न टेक्स्ट को वॉटरमार्क करेगा। इसके लिए, टूलकिट जनरेशन प्रक्रिया को ही लक्षित करेगा। प्रत्येक टेक्स्ट-आधारित AI मॉडल प्रशिक्षण के लिए टोकन का उपयोग करता है – जो शब्द, शब्दांश या वाक्यांश हो सकते हैं। प्रशिक्षण प्रक्रिया में इन टोकन का उपयोग करने के प्रवाह को समझना या सबसे सुसंगत प्रतिक्रिया उत्पन्न करने के लिए टोकन का पालन करने का क्रम भी शामिल है।

सिंथआईडी “टोकन के उत्पन्न होने की संभावना को संशोधित करके पीढ़ी के बिंदु पर टोकन वितरण में अतिरिक्त जानकारी पेश करता है।” इस तरह यह उत्पन्न पाठ के एक ब्लॉक में कुछ शब्दों को एक संख्या प्रदान करता है। जब यह पता लगाया जाता है कि पाठ को उत्पन्न करने के लिए AI का उपयोग किया गया था, तो यह निर्धारित करने के लिए अपने समायोजित संभाव्यता स्कोर के विरुद्ध स्कोर की जाँच करता है कि स्रोत AI मॉडल हो सकता है या नहीं। डीपमाइंड ने एक पोस्ट में इस बात पर प्रकाश डाला कि यह तकनीक तब उपयोगी होती है जब AI लंबा रचनात्मक पाठ उत्पन्न करता है क्योंकि संभाव्यता मॉडल के लिए यह जाँचना आसान होता है कि इसे कैसे बनाया गया था। हालाँकि, छोटी तथ्यात्मक प्रतिक्रियाओं के लिए, पता लगाना उतना सटीक नहीं हो सकता है।

कंपनी सिंथआईडी का विस्तार हाल ही में वीओ के एआई-जनरेटेड वीडियो में भी कर रही है। गूगल ने कहा कि यह तकनीक हर वीडियो फ्रेम के पिक्सल में सीधे वॉटरमार्क एम्बेड करेगी जो मानव आंखों के लिए अदृश्य होगा लेकिन डिटेक्शन सिस्टम का उपयोग करने पर दिखाई देगा।

आने वाले महीनों में, Google अपने रिस्पॉन्सिबल जेनरेटिव AI टूलकिट के ज़रिए सिंथआईडी टेक्स्ट वॉटरमार्किंग को ओपन-सोर्स करने की योजना बना रहा है। यह टेक्स्ट वॉटरमार्किंग तकनीक को समझाने वाला एक विस्तृत शोध पत्र भी प्रकाशित करेगा।

Source link

Post Views: 49