Tumblr, WordPress Plan to Sell User Data to OpenAI and Midjourney to Train AI Models: Report
एक रिपोर्ट के अनुसार, टम्बलर और वर्डप्रेस उपयोगकर्ताओं को जल्द ही पता चल सकता है कि उनके डेटा का उपयोग कृत्रिम बुद्धिमत्ता (एआई) मॉडल को प्रशिक्षित करने के लिए किया जा रहा है। ब्लॉग साइट्स की मूल कंपनी, ऑटोमैटिक ने कथित तौर पर ओपनएआई और मिडजर्नी के साथ उपयोगकर्ता-जनित सामग्री बेचने के लिए सौदे किए हैं, जिसका उपयोग कथित तौर पर एआई को प्रशिक्षित करने में किया जाएगा। हालाँकि सौदे और डेटा-शेयरिंग प्रथाओं का विवरण फिलहाल अस्पष्ट है, लेकिन इसने डेटा गोपनीयता और कंपनियों द्वारा अपने उपयोगकर्ताओं के डेटा को तीसरे पक्ष के साथ साझा करने की नैतिकता पर सवाल उठाया है।
404 मीडिया द्वारा देखे गए ऑटोमेटिक के कर्मचारियों के आंतरिक संचार ने एआई कंपनियों के साथ सौदे की पुष्टि की और इन प्रथाओं के बारे में विवरण प्रकट किया। अपनी रिपोर्ट में, प्रकाशन ने पुष्टि की कि ओपनएआई और मिडजर्नी के साथ ऑटोमेटिक के सौदे की घोषणा जल्द ही की जा सकती है। इसके अलावा, ऐसा प्रतीत होता है कि एआई फर्मों के लिए डेटा संकलन पहले ही शुरू हो चुका है। इस बीच, एक उत्पाद प्रबंधक साइल गेज द्वारा किए गए एक आंतरिक पोस्ट ने सुझाव दिया कि 2014 और 2023 के बीच टम्बलर की सभी सार्वजनिक पोस्ट सामग्री संकलित की गई थी।
रिपोर्ट में एक खास संदेश पर भी प्रकाश डाला गया है, जो बताता है कि सार्वजनिक डेटा के साथ-साथ निजी और हटाई गई उपयोगकर्ता सामग्री भी स्वचालित रूप से संकलित की गई थी। यह स्पष्ट नहीं था कि डेटा का वह सेट पहले से ही AI फर्मों के साथ साझा किया गया था या नहीं। इसके अलावा, चूंकि इस तरह की दुर्घटना इसके पूरे उपयोगकर्ता आधार की निजी जानकारी को खतरे में डालती है, इसलिए यह कंपनी की नैतिक नीति और डेटा सुरक्षा बुनियादी ढांचे के बारे में भी सवाल उठाती है।
ऑटोमैटिक ने मंगलवार को एक बयान जारी कर कहा, “एआई हमारी दुनिया के लगभग हर पहलू को तेज़ी से बदल रहा है, जिसमें कंटेंट बनाने और उसका उपभोग करने का तरीका भी शामिल है। ऑटोमैटिक में, हम हमेशा एक स्वतंत्र और खुले वेब और व्यक्तिगत पसंद में विश्वास करते हैं। अन्य तकनीकी कंपनियों की तरह, हम इन प्रगति का बारीकी से अनुसरण कर रहे हैं, जिसमें एआई कंपनियों के साथ इस तरह से काम करना शामिल है जो हमारे उपयोगकर्ताओं की प्राथमिकताओं का सम्मान करता है।”
पोस्ट में कंपनी द्वारा अपने उपयोगकर्ताओं के लिए किए जा रहे कई कामों के बारे में विस्तार से बताया गया है, जिसमें AI प्लेटफ़ॉर्म क्रॉलर को ब्लॉक करना, वर्डप्रेस और टम्बलर पर साइट को इंडेक्स करने से सर्च इंजन को हतोत्साहित करने की सेटिंग और उन उपयोगकर्ताओं के लिए ऑप्ट-आउट सेटिंग का आश्वासन शामिल है जो तीसरे पक्ष के साथ डेटा साझा नहीं करना चाहते हैं। पोस्ट में कहा गया है, “वर्तमान में, ऐसा कोई कानून मौजूद नहीं है जो क्रॉलर को इन प्राथमिकताओं का पालन करने की आवश्यकता रखता हो।”
डेटा शेयरिंग से ऑप्ट-आउट करने का तंत्र भी कुछ हद तक अस्पष्ट है। जबकि कंपनी ने पोस्ट में कहा है कि AI फ़र्म ऑप्ट-आउट सेटिंग्स का सम्मान करेंगी और यहां तक कि हाल ही में ऑप्ट-आउट करने वाले उपयोगकर्ताओं से पिछली सामग्री को भी हटा देंगी, रिपोर्ट का दावा है कि वास्तविकता अधिक जटिल है।
रिपोर्ट में 23 फरवरी का एक आंतरिक दस्तावेज मिला, जिसमें एक कर्मचारी ने पूछा कि क्या कंपनी के पास कोई आश्वासन है कि डेटा पार्टनर उपयोगकर्ताओं द्वारा लिए गए ऑप्ट-आउट निर्णय का सम्मान करेगा। ऑटोमैटिक के एआई प्रमुख एंड्रयू स्पिटल ने कथित तौर पर जवाब दिया, “हम मांग करेंगे कि सामग्री को हटा दिया जाए और भविष्य के किसी भी प्रशिक्षण रन से हटा दिया जाए। मेरा मानना है कि भागीदार इस बिंदु पर हमारी बातचीत के आधार पर इसका सम्मान करेंगे। मुझे नहीं लगता कि इसे बनाए रखने से उन्हें कुल मिलाकर बहुत कुछ हासिल होगा।”
रिपोर्ट के अनुसार, जवाब अस्पष्ट पाया गया और यह पुष्टि नहीं करता है कि ऑटोमैटिक के पास इस पर कोई समझौता था या नहीं। इसके अलावा, ऐसा प्रतीत होता है कि तर्क की पूरी लाइन इस धारणा पर टिकी हुई है कि एआई फर्मों को उपयोगकर्ता डेटा को बनाए रखने से बहुत अधिक लाभ नहीं होगा। यह ध्यान दिया जाना चाहिए कि तीसरे पक्ष के डेटा शेयरिंग का चलन नया नहीं है, और अधिकांश सोशल मीडिया प्लेटफ़ॉर्म प्लेटफ़ॉर्म पर उपयोगकर्ता द्वारा उत्पन्न सार्वजनिक सामग्री के अधिकार रखते हैं। हालाँकि, उपयोगकर्ताओं को बताए बिना इस तरह के सौदे करने से संभावित रूप से निजी जानकारी उन कंपनियों के सामने आ सकती है जो उसी डेटा का उपयोग AI सिस्टम को प्रशिक्षित करने के लिए कर रही हैं।