قامت Apple بتدريب نماذج الذكاء الاصطناعي على محتوى YouTube دون موافقة
قام عدد من عمالقة التكنولوجيا، بما في ذلك شركة آبل، بتدريب نماذج الذكاء الاصطناعي على مقاطع فيديو يوتيوب دون موافقة المبدعين، وفقًا لتقرير جديد اليوم.
لقد فعلوا ذلك باستخدام ملفات الترجمة التي تم تنزيلها بواسطة جهة خارجية من أكثر من 170.000 مقطع فيديو. من بين منشئي المحتوى المتأثرين المراجع الفني Marquees Brownlee (MKBHD)، وMrBeast، وPewDiePie، وStephen Colbert، وJohn Oliver، وJimmy Kimmel…
تعد ملفات الترجمة بمثابة نسخ فعالة لمحتوى الفيديو.
سلكي التقارير.
توصل تحقيق أجرته Proof News إلى أن بعض أغنى شركات الذكاء الاصطناعي في العالم استخدمت مواد من آلاف مقاطع الفيديو على YouTube لتدريب الذكاء الاصطناعي. فعلت الشركات ذلك على الرغم من قواعد يوتيوب التي تمنع جمع المواد من المنصة دون إذن.
توصل تحقيقنا إلى أن الترجمات المصاحبة لـ 173.536 مقطع فيديو على YouTube، تم سحبها من أكثر من 48.000 قناة، تم استخدامها من قبل الشركات ذات الوزن الثقيل في وادي السيليكون، بما في ذلك Anthropic وNvidia وApple وSalesforce.
وبحسب ما ورد تم إجراء التنزيلات من قبل منظمة غير ربحية تدعى EleutherAI، والتي تقول إنها تساعد المطورين على تدريب نماذج الذكاء الاصطناعي. وفي حين يبدو أن الهدف كان توفير مواد تدريبية للمطورين الصغار والأكاديميين، فقد تم استخدام مجموعة البيانات أيضًا من قبل العديد من عمالقة التكنولوجيا، بما في ذلك شركة آبل.
وفقًا لورقة بحثية نشرتها EleutherAI، فإن مجموعة البيانات هي جزء من مجموعة أصدرتها المنظمة غير الربحية تسمى The Pile […]
يمكن الوصول إلى معظم مجموعات بيانات Pile وهي مفتوحة لأي شخص على الإنترنت لديه مساحة كافية وقدرة حاسوبية للوصول إليها. وقد استفاد الأكاديميون والمطورون الآخرون خارج شركات التكنولوجيا الكبرى من مجموعة البيانات، لكنهم لم يكونوا الوحيدين.
تصف شركات Apple وNvidia وSalesforce – وهي شركات تقدر قيمتها بمئات المليارات وتريليونات الدولارات – في أوراقها البحثية ومنشوراتها كيف استخدمت Pile لتدريب الذكاء الاصطناعي. وتظهر الوثائق أيضًا أن شركة آبل استخدمت Pile لتدريب OpenELM، وهو نموذج رفيع المستوى تم إصداره في أبريل، قبل أسابيع من إعلان الشركة أنها ستضيف إمكانات جديدة للذكاء الاصطناعي إلى أجهزة iPhone وMacBook.
سلكي تقول شركة Apple لم تستجب لطلب التعليق في وقت كتابة هذا التقرير.
خذ 9to5Mac
من المهم التأكيد هنا على أن شركة Apple لم تقم بتنزيل البيانات بنفسها، ولكن بدلاً من ذلك تم تنفيذ ذلك بواسطة EleutherAI. يبدو أن هذه المنظمة قد انتهكت شروط وأحكام YouTube.
ومع ذلك، في حين أن شركة آبل والشركات الأخرى المذكورة استخدمت على الأرجح مجموعة بيانات متاحة للجمهور بحسن نية، إلا أنها مثال جيد لحقل الألغام القانوني الذي تم إنشاؤه عن طريق تجريف الويب لتدريب أنظمة الذكاء الاصطناعي. كانت هناك أمثلة متعددة لأنظمة الذكاء الاصطناعي التي تنتحل فقرات كاملة من النص عند سؤالها عن موضوعات متخصصة، وتزداد مخاطر استخدام المواد دون إذن فقط عندما تستخدم الشركات مجموعات البيانات التي جمعتها أطراف ثالثة.
لقد تواصلنا مع شركة Apple للتعليق، وسنقوم بالتحديث بأي رد.
لقطة الشاشة: MKBHD
FTC: نحن نستخدم الروابط التابعة التلقائية لكسب الدخل. أكثر.