الأخبار

WordPress وTumblr سيبيعان بيانات المستخدم لتدريب نماذج الذكاء الاصطناعي

أبرمت الشركة الأم لـ Tumblr و WordPress، Automattic، صفقة لبيع بيانات المستخدم لتدريب نماذج الذكاء الاصطناعي (AI).

تم اكتشاف الصفقة بواسطة 404media، حيث حصل موقع أخبار التكنولوجيا على مستندات داخلية تظهر بيع البيانات الوشيك مع شركات مثل Midjourney وOpenAI.

تزعم 404media أنه سيكون هناك إعداد جديد تم تقديمه اليوم من شأنه "السماح للمستخدمين بإلغاء الاشتراك في مشاركة البيانات مع أطراف ثالثة، بما في ذلك شركات الذكاء الاصطناعي".

كيف تخطط Automattic لاستخدام الذكاء الاصطناعي
لدى Automattic بيان على موقعها بعنوان "حماية اختيار المستخدم" ويتناول بالتفصيل موقف الشركة من الذكاء الاصطناعي.

وجاء في البيان: "يعمل الذكاء الاصطناعي على إحداث تحول سريع في كل جانب من جوانب عالمنا تقريبًا، بما في ذلك الطريقة التي ننشئ بها المحتوى ونستهلكه". "في Automattic، نحن نؤمن دائمًا بالويب الحر والمفتوح والاختيار الفردي. ومثل شركات التكنولوجيا الأخرى، فإننا نتابع هذه التطورات عن كثب، بما في ذلك كيفية العمل مع شركات الذكاء الاصطناعي بطريقة تحترم تفضيلات مستخدمينا.

تذكر الشركة أيضًا أنها تحظر حاليًا برامج زحف الذكاء الاصطناعي ومواقع فهرسة محركات البحث لإبقاء منشورات المستخدم بعيدًا عن أعينهم، ما لم يوافق المستخدم على أن يكون هذا المحتوى عامًا.

ستناقش شركة Automattic أيضًا عملها بشكل علني مع أطراف ثالثة قائلة: "إننا نعمل أيضًا بشكل مباشر مع شركات مختارة للذكاء الاصطناعي طالما أن خططها تتوافق مع ما يهتم به مجتمعنا: الإسناد، وإلغاء الاشتراك، والتحكم".

وجاء في البيان الخاص بالذكاء الاصطناعي: "ستحترم شراكاتنا جميع إعدادات إلغاء الاشتراك". "نحن نخطط أيضًا لاتخاذ هذه الخطوة إلى الأمام وتحديث أي شركاء بانتظام بشأن الأشخاص الذين قاموا بإلغاء الاشتراك حديثًا ونطلب إزالة المحتوى الخاص بهم من المصادر السابقة والتدريب المستقبلي".

لذلك لم يتم بعد رؤية صفقة مع شركات الذكاء الاصطناعي والتأثيرات المحددة على بيانات المستخدم، لكن العلاقة بين تقرير 404media وهذا البيان العام تظهر أن شركة Automattic تدرس بالفعل الآثار المترتبة على المعلومات العامة والذكاء الاصطناعي.

لماذا تريد شركات الذكاء الاصطناعي الوصول إلى بيانات المستخدم؟
تحتاج شركات الذكاء الاصطناعي وخوارزمياتها المعقدة إلى مصدر بيانات ليتم "تدريبه" بشكل أساسي على مجموعة أو موضوع محدد.

كلما كانت البيانات التي تغذي نماذج التعلم هذه أفضل، كلما كانت النتائج أكثر دقة من الناحية النظرية. على سبيل المثال، نموذج الذكاء الاصطناعي الذي يمكنه الوصول إلى بيانات محدودة فقط سيكون له سلطة محدودة في موضوع معين.

إن إعاقة التنظيم بشأن الذكاء الاصطناعي، الذي كان بيئة خارجة عن القانون إلى حد ما، يعني أنه يجب إبرام المزيد من الصفقات مع الشركات التي يمكنها الوصول إلى مجموعات البيانات هذه للحصول على أفضل عائد لاستعلام الذكاء الاصطناعي. وهذا يعني أيضًا أن مالكي نماذج التعلم لا يخالفون الجانب القانوني لحقوق الطبع والنشر للبيانات، وأن أولئك الذين يمتلكون منصات مثل Tumblr وWordPress يحصلون على شيء ما مقابل الوصول إلى بيانات المستخدم.