ChatGpt Controversy: OpenAI के नए AI मॉडल GPT-4o पर पेड (paywalled) किताबों से ट्रेनिंग लेने का गंभीर आरोप लगा है. AI Disclosures Project, एक नॉन-प्रॉफिट AI वॉचडॉग संगठन, ने अपनी नई रिसर्च रिपोर्ट में दावा किया है कि OpenAI ने O’Reilly Media द्वारा प्रकाशित कई पेड किताबों का इस्तेमाल अपनी मॉडल ट्रेनिंग में किया.

Also Read This: UPI Down: Google Pay से Paytm समेत कई ऐप्स ठप, SBI तक के यूजर्स भी हो रहे परेशान…

क्या कहती है रिपोर्ट?

रिसर्च पेपर के अनुसार, GPT-4o में पेड O’Reilly बुक्स को पहचानने की अधिक क्षमता है, जबकि OpenAI का पुराना मॉडल GPT-3.5 Turbo ऐसी किताबों की पहचान कम करता है.

रिपोर्ट में लिखा गया है: “GPT-4o, OpenAI का सबसे एडवांस मॉडल, O’Reilly की पेड बुक्स को अधिक पहचानता है, जबकि GPT-3.5 Turbo मुख्य रूप से सार्वजनिक रूप से उपलब्ध O’Reilly बुक्स को पहचानता है.”

रिसर्च के अनुसार, GPT-4o के ट्रेनिंग डेटा में O’Reilly की नॉन-पब्लिक बुक्स शामिल हो सकती हैं, जबकि OpenAI और O’Reilly Media के बीच कोई लाइसेंसिंग समझौता नहीं है.

OpenAI पहले से ही कई मुकदमों का सामना कर रहा है (ChatGpt Controversy)

Microsoft समर्थित OpenAI पहले से ही कई कॉपीराइट उल्लंघन के मुकदमों का सामना कर रहा है. विभिन्न लेखक और मीडिया संस्थान OpenAI पर उनकी अनुमति के बिना कॉन्टेंट का इस्तेमाल करने का आरोप लगा चुके हैं.

GPT-4o के ट्रेनिंग डेटा की जांच कैसे हुई? (ChatGpt Controversy)

रिसर्चर्स ने “membership inference attack” (DE-COP) नाम की तकनीक का इस्तेमाल किया.

Also Read This: OnePlus 12 पर बंपर डिस्काउंट, ₹13,000 की कटौती के साथ मिल रहा शानदार ऑफर…

यह तकनीक जांच करती है कि क्या AI मॉडल किसी किताब के ओरिजिनल टेक्स्ट और AI द्वारा पैराफ्रेज़ किए गए टेक्स्ट के बीच अंतर को समझ सकता है.

  • यदि AI मॉडल इस अंतर को पहचान लेता है, तो यह संकेत देता है कि उसने उस किताब को पहले से अपने ट्रेनिंग डेटा में देखा है.
  • इस स्टडी में O’Reilly Media की 34 किताबों से 13,962 पैराग्राफ्स का विश्लेषण किया गया.
  • नतीजों से पता चला कि GPT-4o को O’Reilly की पेड बुक्स को पहचानने में अधिक सक्षम पाया गया, जबकि GPT-3.5 Turbo और अन्य पुराने मॉडल की पहचान क्षमता कम थी.

AI ट्रेनिंग पर बढ़ता विवाद: OpenAI और Google की लॉबिंग (ChatGpt Controversy)

OpenAI और Google ने अमेरिकी प्रशासन पर दबाव बनाया है कि AI मॉडल को कॉपीराइटेड कंटेंट से ट्रेनिंग देने को “Fair Use” के तहत वैध माना जाए.

OpenAI पहले ही न्यूज़ पब्लिशर्स, सोशल नेटवर्क्स, स्टॉक मीडिया लाइब्रेरीज़ आदि से डेटा लाइसेंसिंग डील्स कर चुका है.
इसके अलावा, OpenAI ने पत्रकारों को हायर किया है ताकि वे AI के आउटपुट को बेहतर बनाने में मदद कर सकें.

क्या OpenAI पर कार्रवाई होगी? (ChatGpt Controversy)

हालांकि OpenAI पर पहले भी कॉपीराइट उल्लंघन के कई आरोप लगे हैं, लेकिन इस मामले में अभी तक कोई कानूनी कार्रवाई की पुष्टि नहीं हुई है.

आपकी राय क्या है? (ChatGpt Controversy)

क्या AI कंपनियों को बिना अनुमति के पेड बुक्स और अन्य कॉपीराइटेड कंटेंट का इस्तेमाल करना चाहिए?

Also Read This: अगर आप भी कंप्यूटर का इस्तेमाल Microsoft जल्द ही करने जा रहा है ये बदलाव…