एआई वीडियो में विशेषज्ञता वाले स्टार्टअप रनवे ने कथित तौर पर बिना प्राधिकरण के “हजारों” यूट्यूब वीडियो पर प्रशिक्षण दिया

एआई वीडियो में विशेषज्ञता वाले स्टार्टअप रनवे ने कथित तौर पर बिना प्राधिकरण के “हजारों” यूट्यूब वीडियो पर प्रशिक्षण दिया

आर्टिफिशियल इंटेलिजेंस कंपनी रनवे ने कथित तौर पर बिना अनुमति के “हजारों” YouTube वीडियो और कॉपीराइट फिल्मों के पायरेटेड संस्करणों को हटा दिया है। 404 मीडिया प्राप्त कथित आंतरिक स्प्रेडशीट से पता चलता है कि एआई वीडियो जेनरेशन स्टार्टअप ने अपने जेन-3 मॉडल को डिज्नी, नेटफ्लिक्स, पिक्सर और लोकप्रिय मीडिया आउटलेट जैसे चैनलों की यूट्यूब सामग्री का उपयोग करके प्रशिक्षित किया है।

रनवे के एक कथित पूर्व कर्मचारी ने प्रकाशन को बताया कि कंपनी स्प्रेडशीट का उपयोग उन वीडियो की सूचियों को चिह्नित करने के लिए करती थी जिन्हें वह अपने डेटाबेस में डालना चाहती थी। फिर उसने अपने ट्रैक को कवर करने के लिए ओपन सोर्स प्रॉक्सी सॉफ़्टवेयर का उपयोग करके बिना पहचाने उन्हें डाउनलोड किया। एक शीट में अंतरिक्ष यात्री, परी और इंद्रधनुष जैसे सरल कीवर्ड सूचीबद्ध हैं, जिसमें फ़ुटनोट यह दर्शाते हैं कि क्या कंपनी को अभ्यास के लिए उच्च गुणवत्ता वाले वीडियो मिलते हैं। उदाहरण के लिए, “सुपरहीरो” शब्द में एक नोट शामिल है जिसमें लिखा है “बहुत सारी मूवी क्लिप।” (वास्तव में।)

अन्य नोट्स से पता चलता है कि रनवे के अनरियल इंजन, फिल्म निर्माता जोश न्यूमैन और कॉल ऑफ़ ड्यूटी फैन पेज के लिए रिपोर्ट किए गए यूट्यूब चैनल “हाई मूवमेंट” प्रशिक्षण वीडियो के लिए अच्छे स्रोत हैं।

पूर्व कर्मचारी ने कहा, “इस स्प्रेडशीट में चैनल मॉडल बनाने के लिए अच्छी गुणवत्ता वाले वीडियो ढूंढने के कंपनी-व्यापी प्रयास का परिणाम थे।” 404 मीडिया“इस डेटा को तब एक विशाल वेब क्रॉलर द्वारा इनपुट के रूप में उपयोग किया गया था, जिसने Google द्वारा अवरुद्ध होने से बचने के लिए प्रॉक्सी का उपयोग करके इन सभी चैनलों से सभी वीडियो डाउनलोड किए थे। »

रनवे एआई होमपैड का स्क्रीनशॉट।
रास्ता

एक स्प्रेडशीट में संकलित लगभग 4,000 YouTube चैनलों की सूची में सीबीएस न्यूयॉर्क, एएमसी थिएटर्स, पिक्सर, डिज़नी प्लस, डिज़नी सीडी और मोंटेरे बे एक्वेरियम से “अनुशंसित चैनलों” को चिह्नित किया गया है। (क्योंकि कोई भी एआई मॉडल ऊदबिलाव के बिना पूरा नहीं होता है।)

रनवे ने कथित तौर पर पायरेसी साइटों से वीडियो की एक अलग सूची भी संकलित की। “नॉन-यूट्यूब सोर्स” शीर्षक वाली एक स्प्रेडशीट में स्टूडियो घिबली फिल्मों का अनधिकृत ऑनलाइन संग्रह, एनीमे और मूवी पायरेसी साइट्स, एक्सबॉक्स गेम्स से वीडियो प्रदर्शित करने वाली एक प्रशंसक साइट और एनीमे स्ट्रीमिंग साइट Kisscartoon.sh जैसे स्रोतों के 14 लिंक शामिल हैं।

इसे इस बात की पुष्टि के रूप में देखा जा सकता है कि कंपनी ने प्रशिक्षण डेटा का उपयोग किया था, 404 मीडिया शोधकर्ताओं ने पाया कि स्प्रेडशीट में सूचीबद्ध लोकप्रिय YouTubers के नाम के लिए वीडियो जनरेटर से पूछने पर एक अलौकिक समानता वाले परिणाम उत्पन्न हुए। महत्वपूर्ण रूप से, रनवे के पुराने जेन-2 मॉडल में समान नाम दर्ज करना – स्प्रेडशीट में अनुमानित डेटा से पहले प्रशिक्षित – सूट में सामान्य पुरुषों की तरह, “असंबंधित” परिणाम उत्पन्न करता है। इसके अतिरिक्त, जब प्रकाशन ने रनवे से यह पूछने के लिए संपर्क किया कि क्या YouTubers की समानताएँ परिणामों में दिखाई दे रही हैं, तो AI उपकरण ने उन्हें पूरी तरह से उत्पन्न करना बंद कर दिया।

पूर्व कर्मचारी ने कहा, “मुझे उम्मीद है कि इस जानकारी को साझा करने से लोगों को इन कंपनियों के पैमाने की बेहतर समझ होगी और वे ‘शानदार’ वीडियो बनाने के लिए क्या करते हैं।” 404 मीडिया.

टिप्पणी के लिए संपर्क करने पर एक यूट्यूब प्रतिनिधि ने Engadget को बताया साक्षात्कार इसके सीईओ नील मोहन ने दी ब्लूमबर्ग अप्रैल में, मोहन ने अपने वीडियो में प्रशिक्षण को अपनी शर्तों का “घोर उल्लंघन” बताया। YouTube के प्रवक्ता जैक मेसन ने Engadget को लिखा, “इस पर हमारी पिछली टिप्पणियाँ अभी भी कायम हैं।”

रनवे ने प्रकाशन के समय टिप्पणी के अनुरोध का जवाब नहीं दिया।

कम से कम कुछ एआई कंपनियां अपने उपकरणों को मानकीकृत करने और उपयोगकर्ताओं और अदालतों के सामने बाजार नेतृत्व स्थापित करने के लिए प्रतिस्पर्धा कर रही हैं – यह पता लगाने के लिए कि उनका उत्पाद कैसे बनाया गया था। लाइसेंसिंग समझौतों के माध्यम से अनुमति के साथ प्रशिक्षण एक बात है, और यह एक और रणनीति है जिसे ओपनएआई जैसी कंपनियों ने हाल ही में अपनाया है। लेकिन पूरे इंटरनेट को – कॉपीराइट सामग्री सहित – लाभ और वर्चस्व की उन्मत्त दौड़ में हिस्सेदारी के रूप में मानना ​​कहीं अधिक संदिग्ध (या यहां तक ​​कि अवैध) है।

404 मीडियाउत्कृष्ट है रिपोर्ट पढ़ने लायक है.

Comments

No comments yet. Why don’t you start the discussion?

प्रातिक्रिया दे

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *