لقد كان عام الذكاء الاصطناعي التوليدي (Generative Artificial Intelligence) جيدًا للغاية. تعمل شركات مثل Microsoft و Adobe و GitHub على دمج التكنولوجيا في منتجاتها؛ تجمع الشركات الناشئة مئات الملايين للتنافس معهم؛ وحتى البرنامج يتمتع بنفوذ ثقافي، مع نماذج الذكاء الاصطناعي لتحويل النص إلى صورة والتي تولد عددًا لا يحصى من الميمات. لكن استمع إلى أي نقاش صناعي حول الذكاء الاصطناعي التوليدي، وستسمع، في الخلفية، سؤالًا يهمس به المدافعون والنقاد على حد سواء بنبرة قلق متزايدة: هل أي من هذا قانوني بالفعل؟
السؤال الذي يطرح نفسه بسبب الطريقة التي يتم بها تدريب أنظمة الذكاء الاصطناعي التوليدية. مثل معظم برامج التعلم الآلي، فهي تعمل من خلال تحديد الأنماط في البيانات وتكرارها. ولكن نظرًا لاستخدام هذه البرامج لإنشاء التعليمات البرمجية والنصوص والموسيقى والفن، فإن هذه البيانات نفسها يتم إنشاؤها بواسطة البشر، ويتم استخراجها من الويب وحقوق الطبع والنشر المحمية بطريقة أو بأخرى.
بالنسبة لباحثي الذكاء الاصطناعي في الماضي الضبابي البعيد (المعروف أيضًا باسم 2010)، لم تكن هذه مشكلة كبيرة. في ذلك الوقت، كانت النماذج الحديثة قادرة فقط على إنتاج صور ضبابية بالأبيض والأسود بحجم أظافر الأصابع. لم يكن هذا تهديدًا واضحًا للبشر. ولكن في عام 2022، عندما يمكن للهواة استخدام برنامج مثل Stable Diffusion لنسخ أسلوب الفنان في غضون ساعات أو عندما تبيع الشركات المطبوعات التي تم إنشاؤها بواسطة AI وفلاتر الوسائط الاجتماعية التي تعتبر عمليات تقليد صريحة للمصممين الأحياء، فإن الأسئلة الشرعية والأخلاق أصبحت أكثر إلحاحًا.
خذ حالة هولي مينجرت، رسامة ديزني التي وجدت أن أسلوبها الفني قد تم استنساخه كتجربة ذكاء اصطناعي بواسطة طالبة هندسة ميكانيكية في كندا. نزَّلت الطالبة 32 قطعة من قطع Mengert واستغرقت بضع ساعات لتدريب نموذج للتعلم الآلي يمكنه إعادة إنتاج أسلوبها. كما قالت منجرت للتقني آندي بايو، الذي أبلغ عن الحالة: "بالنسبة لي، شخصيًا، يبدو الأمر وكأن شخصًا ما أخذ عملاً قمت به، كما تعلم، الأشياء التي تعلمتها - لقد كنت فنانًا عاملاً منذ تخرجي مدرسة الفنون في عام 2011 - وتستخدمها لإنشاء فن لم أوافق عليه ولم أعطي الإذن به".
لكن هل هذا عادل؟ وهل تستطيع Mengert فعل أي شيء حيال ذلك؟
للإجابة على هذه الأسئلة وفهم المشهد القانوني المحيط بالذكاء الاصطناعي التوليدي، تم الحديث إلى مجموعة من الخبراء، بما في ذلك المحامين والمحللين والموظفين في شركات الذكاء الاصطناعي الناشئة. قال البعض بثقة أن هذه الأنظمة كانت بالتأكيد قادرة على انتهاك حقوق النشر ويمكن أن تواجه تحديات قانونية خطيرة في المستقبل القريب. اقترح آخرون، على نفس القدر من الثقة، أن العكس هو الصحيح: أن كل ما يحدث حاليًا في مجال الذكاء الاصطناعي التوليدي هو قانونًا فوق المنصة وأي دعاوى قضائية محكوم عليها بالفشل.
قال بايو، الذي كان يتابع مشهد الذكاء الاصطناعي التوليدي عن كثب: "أرى الناس على كلا الجانبين واثقين جدًا من مواقفهم، لكن الحقيقة لا أحد يعرفها". "وأي شخص يقول إنه يعرف بثقة كيف سيتم ذلك في المحكمة هو مخطئ".
واقترح Andres Guadamuz، الأكاديمي المتخصص في الذكاء الاصطناعي وقانون الملكية الفكرية بجامعة ساسكس بالمملكة المتحدة، أنه على الرغم من وجود العديد من الأشياء المجهولة، إلا أن هناك أيضًا عددًا قليلاً من الأسئلة الرئيسية التي تبرز من خلالها العديد من أوجه عدم اليقين في الموضوع. أولاً، هل يمكنك امتلاك حقوق الطبع والنشر لمخرجات نموذج الذكاء الاصطناعي التوليدي، وإذا كان الأمر كذلك، فمن يمتلكه؟ ثانيًا، إذا كنت تمتلك حقوق الطبع والنشر للمدخلات المستخدمة لتدريب الذكاء الاصطناعي، فهل يمنحك ذلك أي مطالبة قانونية بشأن النموذج أو المحتوى الذي ينشئه؟ بمجرد الإجابة على هذه الأسئلة، يظهر سؤال أكبر: كيف تتعامل مع تداعيات هذه التكنولوجيا؟ ما نوع القيود القانونية التي يمكن - أو ينبغي - وضعها على جمع البيانات؟ وهل يمكن أن يكون هناك سلام بين الأشخاص الذين يبنون هذه الأنظمة وأولئك الذين تكون بياناتهم مطلوبة لإنشائها؟
لنأخذ هذه الأسئلة واحدًا تلو الآخر.
السؤال الذي يطرح نفسه بسبب الطريقة التي يتم بها تدريب أنظمة الذكاء الاصطناعي التوليدية. مثل معظم برامج التعلم الآلي، فهي تعمل من خلال تحديد الأنماط في البيانات وتكرارها. ولكن نظرًا لاستخدام هذه البرامج لإنشاء التعليمات البرمجية والنصوص والموسيقى والفن، فإن هذه البيانات نفسها يتم إنشاؤها بواسطة البشر، ويتم استخراجها من الويب وحقوق الطبع والنشر المحمية بطريقة أو بأخرى.
بالنسبة لباحثي الذكاء الاصطناعي في الماضي الضبابي البعيد (المعروف أيضًا باسم 2010)، لم تكن هذه مشكلة كبيرة. في ذلك الوقت، كانت النماذج الحديثة قادرة فقط على إنتاج صور ضبابية بالأبيض والأسود بحجم أظافر الأصابع. لم يكن هذا تهديدًا واضحًا للبشر. ولكن في عام 2022، عندما يمكن للهواة استخدام برنامج مثل Stable Diffusion لنسخ أسلوب الفنان في غضون ساعات أو عندما تبيع الشركات المطبوعات التي تم إنشاؤها بواسطة AI وفلاتر الوسائط الاجتماعية التي تعتبر عمليات تقليد صريحة للمصممين الأحياء، فإن الأسئلة الشرعية والأخلاق أصبحت أكثر إلحاحًا.
خذ حالة هولي مينجرت، رسامة ديزني التي وجدت أن أسلوبها الفني قد تم استنساخه كتجربة ذكاء اصطناعي بواسطة طالبة هندسة ميكانيكية في كندا. نزَّلت الطالبة 32 قطعة من قطع Mengert واستغرقت بضع ساعات لتدريب نموذج للتعلم الآلي يمكنه إعادة إنتاج أسلوبها. كما قالت منجرت للتقني آندي بايو، الذي أبلغ عن الحالة: "بالنسبة لي، شخصيًا، يبدو الأمر وكأن شخصًا ما أخذ عملاً قمت به، كما تعلم، الأشياء التي تعلمتها - لقد كنت فنانًا عاملاً منذ تخرجي مدرسة الفنون في عام 2011 - وتستخدمها لإنشاء فن لم أوافق عليه ولم أعطي الإذن به".
لكن هل هذا عادل؟ وهل تستطيع Mengert فعل أي شيء حيال ذلك؟
للإجابة على هذه الأسئلة وفهم المشهد القانوني المحيط بالذكاء الاصطناعي التوليدي، تم الحديث إلى مجموعة من الخبراء، بما في ذلك المحامين والمحللين والموظفين في شركات الذكاء الاصطناعي الناشئة. قال البعض بثقة أن هذه الأنظمة كانت بالتأكيد قادرة على انتهاك حقوق النشر ويمكن أن تواجه تحديات قانونية خطيرة في المستقبل القريب. اقترح آخرون، على نفس القدر من الثقة، أن العكس هو الصحيح: أن كل ما يحدث حاليًا في مجال الذكاء الاصطناعي التوليدي هو قانونًا فوق المنصة وأي دعاوى قضائية محكوم عليها بالفشل.
قال بايو، الذي كان يتابع مشهد الذكاء الاصطناعي التوليدي عن كثب: "أرى الناس على كلا الجانبين واثقين جدًا من مواقفهم، لكن الحقيقة لا أحد يعرفها". "وأي شخص يقول إنه يعرف بثقة كيف سيتم ذلك في المحكمة هو مخطئ".
واقترح Andres Guadamuz، الأكاديمي المتخصص في الذكاء الاصطناعي وقانون الملكية الفكرية بجامعة ساسكس بالمملكة المتحدة، أنه على الرغم من وجود العديد من الأشياء المجهولة، إلا أن هناك أيضًا عددًا قليلاً من الأسئلة الرئيسية التي تبرز من خلالها العديد من أوجه عدم اليقين في الموضوع. أولاً، هل يمكنك امتلاك حقوق الطبع والنشر لمخرجات نموذج الذكاء الاصطناعي التوليدي، وإذا كان الأمر كذلك، فمن يمتلكه؟ ثانيًا، إذا كنت تمتلك حقوق الطبع والنشر للمدخلات المستخدمة لتدريب الذكاء الاصطناعي، فهل يمنحك ذلك أي مطالبة قانونية بشأن النموذج أو المحتوى الذي ينشئه؟ بمجرد الإجابة على هذه الأسئلة، يظهر سؤال أكبر: كيف تتعامل مع تداعيات هذه التكنولوجيا؟ ما نوع القيود القانونية التي يمكن - أو ينبغي - وضعها على جمع البيانات؟ وهل يمكن أن يكون هناك سلام بين الأشخاص الذين يبنون هذه الأنظمة وأولئك الذين تكون بياناتهم مطلوبة لإنشائها؟
لنأخذ هذه الأسئلة واحدًا تلو الآخر.
سؤال الإخراج: هل يمكنك امتلاك حقوق النشر لما ينشئه نموذج الذكاء الاصطناعي؟
بالنسبة للاستعلام الأول، على الأقل، الإجابة ليست صعبة للغاية. في الولايات المتحدة، لا توجد حماية بموجب حقوق الطبع والنشر للأعمال التي تم إنشاؤها بواسطة آلة فقط. ومع ذلك، يبدو أن حق المؤلف قد يكون ممكنًا في الحالات التي يمكن فيها للمبدع إثبات وجود مساهمة بشرية كبيرة.
في سبتمبر، منح مكتب حقوق الطبع والنشر الأمريكي (US Copyright Office) تسجيلًا هو الأول من نوعه لكتاب فكاهي تم إنشاؤه بمساعدة برنامج AI Midjourney من نص إلى صورة. الكتاب الهزلي هو عمل كامل: سرد من 18 صفحة مع شخصيات وحوار وتصميم تقليدي للكتاب الهزلي. وعلى الرغم من أنه تم الإبلاغ منذ ذلك الحين عن مراجعة USCO لقرارها، إلا أنه لم يتم إلغاء تسجيل حقوق الطبع والنشر للرسوم الهزلية بعد. يبدو أن أحد العوامل في المراجعة سيكون درجة المدخلات البشرية التي ينطوي عليها صنع الكوميديا. كريستينا كاشتانوفا، الفنانة التي ابتكرت العمل، أخبرت IPWatchdog أنه طلب منها من قبل USCO "تقديم تفاصيل عن عملي لإظهار أن هناك مشاركة بشرية كبيرة في عملية إنشاء هذه الرواية المصورة". (لا تعلق USCO نفسها على حالات محددة).
وفقًا لـ Guadamuz، ستكون هذه مشكلة مستمرة عندما يتعلق الأمر بمنح حقوق الطبع والنشر للأعمال التي تم إنشاؤها بمساعدة AI. يقول: "إذا كتبت 'قطة بفان جوخ'، فلا أعتقد أن هذا كافٍ للحصول على حقوق الطبع والنشر في الولايات المتحدة". "ولكن إذا بدأت في تجربة المطالبات وأنتجت العديد من الصور وبدأت في ضبط صورك، وبدأت في استخدام البذور، وبدأت في الهندسة أكثر من ذلك بقليل، يمكنني أن أرى ذلك محميًا بموجب حقوق الطبع والنشر".
مع وضع هذا المعيار في الاعتبار، من المحتمل أن الغالبية العظمى من مخرجات نماذج الذكاء الاصطناعي التوليفية لا يمكن أن تكون محمية بحقوق الطبع والنشر. يتم إنتاجها بشكل جماعي باستخدام بضع كلمات رئيسية تستخدم كموجه. لكن المزيد من العمليات المتضمنة من شأنه أن يؤدي إلى حالات أفضل. قد تشمل هذه القطع المثيرة للجدل، مثل المطبوعات التي تم إنشاؤها بواسطة الذكاء الاصطناعي والتي فازت في مسابقة معرض الفنون الحكومية. في هذه الحالة، قال المنشئ إنه أمضى أسابيع في شحذ مطالباته وتحرير القطعة النهائية يدويًا، مما يشير إلى درجة عالية نسبيًا من المشاركة الفكرية.
يقول جورجيو فرانشيسكيلي، عالم الكمبيوتر الذي كتب عن المشكلات المتعلقة بحقوق الطبع والنشر للذكاء الاصطناعي، إن قياس المدخلات البشرية سيكون "صحيحًا بشكل خاص" للبت في القضايا في الاتحاد الأوروبي. وفي المملكة المتحدة - وهي الولاية القضائية الرئيسية الأخرى التي تثير قلق الشركات الناشئة الغربية للذكاء الاصطناعي - يختلف القانون مرة أخرى. على غير العادة، تعد المملكة المتحدة واحدة من عدد قليل من الدول التي تقدم حقوق الطبع والنشر للأعمال التي تم إنشاؤها بواسطة جهاز كمبيوتر فقط، ولكنها تعتبر أن المؤلف هو "الشخص الذي يتم من خلاله اتخاذ الترتيبات اللازمة لإنشاء العمل". مرة أخرى، هناك مجال لقراءات متعددة (هل سيكون هذا "الشخص" مطور النموذج أم مشغله؟)، ولكنه يوفر الأسبقية لمنح نوع من حماية حقوق الطبع والنشر.
في النهاية، على الرغم من ذلك، فإن تسجيل حقوق النشر ليس سوى خطوة أولى، كما يحذر Guadamuz. يقول: "مكتب حقوق النشر في الولايات المتحدة ليس محكمة". "تحتاج إلى التسجيل إذا كنت ستقاضي شخصًا بسبب انتهاك حقوق الطبع والنشر، ولكن ستكون المحكمة هي التي تقرر ما إذا كان ذلك واجب التنفيذ أم لا".
سؤال الإدخال: هل يمكنك استخدام البيانات المحمية بحقوق النشر لتدريب نماذج الذكاء الاصطناعي؟
بالنسبة لمعظم الخبراء، تتعلق أكبر الأسئلة المتعلقة بالذكاء الاصطناعي وحقوق النشر بالبيانات المستخدمة لتدريب هذه النماذج. يتم تدريب معظم الأنظمة على كميات هائلة من المحتوى المأخوذ من الويب؛ سواء أكان ذلك نصًا أو رمزًا أو صورة. مجموعة بيانات التدريب لـ Stable Diffusion، على سبيل المثال - أحد أكبر أنظمة تحويل النص إلى الذكاء الاصطناعي وأكثرها تأثيرًا - تحتوي على مليارات الصور المأخوذة من مئات المجالات؛ كل شيء من المدونات الشخصية المستضافة على WordPress و Blogspot إلى المنصات الفنية مثل DeviantArt ومواقع الصور المخزنة مثل Shutterstock و Getty Images. في الواقع، فإن مجموعات البيانات التدريبية للذكاء الاصطناعي التوليدي واسعة جدًا لدرجة أن هناك فرصة جيدة لأن تكون بالفعل في واحدة (هناك أيضًا موقع ويب يمكنك التحقق منه عن طريق تحميل صورة أو البحث في بعض النصوص).
المبرر الذي يستخدمه باحثو الذكاء الاصطناعي والشركات الناشئة وشركات التكنولوجيا بمليارات الدولارات على حد سواء هو أن استخدام هذه الصور مشمول (في الولايات المتحدة على الأقل) من خلال مبدأ الاستخدام العادل، والذي يهدف إلى تشجيع استخدام الأعمال المحمية بحقوق الطبع والنشر لتعزيز الحرية. من التعبير.
عند تحديد ما إذا كان هناك شيء ما يعد استخدامًا عادلاً، هناك عدد من الاعتبارات، كما يوضح دانييل جيرفيس، الأستاذ في كلية فاندربيلت للقانون المتخصص في قانون الملكية الفكرية، وقد كتب على نطاق واسع حول كيفية تداخل ذلك مع الذكاء الاصطناعي. على الرغم من ذلك، هناك عاملان لهما "أهمية أكبر بكثير"، كما يقول. "ما هو الغرض أو طبيعة الاستخدام وما هو تأثير ذلك على السوق." بعبارة أخرى: هل تغير حالة الاستخدام طبيعة المادة بطريقة ما (توصف عادةً بأنها استخدام "تحويلي")، وهل تهدد مصدر رزق المبدع الأصلي من خلال التنافس مع أعماله؟
بالنظر إلى العبء الملقى على هذه العوامل، يقول Gervais "من المرجح أكثر بكثير" أن يتم تغطية أنظمة التدريب على البيانات المحمية بحقوق الطبع والنشر من خلال الاستخدام العادل. لكن لا يمكن قول الشيء نفسه بالضرورة عن إنشاء المحتوى. بمعنى آخر: يمكنك تدريب نموذج ذكاء اصطناعي باستخدام بيانات أشخاص آخرين، ولكن ما تفعله بهذا النموذج قد يمثل انتهاكًا. فكر في الأمر على أنه الفرق بين جني أموال وهمية لفيلم ومحاولة شراء سيارة به.
ضع في اعتبارك نفس نموذج AI للنص إلى الصورة الذي تم نشره في سيناريوهات مختلفة. إذا تم تدريب النموذج على عدة ملايين من الصور وتم استخدامه لإنشاء صور جديدة، فمن غير المرجح أن يشكل ذلك انتهاكًا لحقوق الطبع والنشر. تم تحويل بيانات التدريب في العملية، والمخرجات لا تهدد سوق الفن الأصلي. ولكن، إذا قمت بضبط هذا النموذج على 100 صورة بواسطة فنان معين وقمت بإنشاء صور تتناسب مع أسلوبهم، فسيكون للفنان غير السعيد حجة أقوى بكثير ضدك.
يقول جيرفيه: "إذا أعطيت 10 روايات عن الذكاء الاصطناعي لستيفن كينج وقلت، 'أنتج رواية لستيفن كينج'، فأنت تنافس ستيفن كينج مباشرة. هل هذا يعتبر استخداما عادلا؟ على الأرجح لا".
بشكل حاسم، بين هذين القطبين للاستخدام العادل وغير العادل، هناك عدد لا يحصى من السيناريوهات التي تكون فيها المدخلات والغرض والمخرجات متوازنة بشكل مختلف ويمكن أن تؤثر على أي حكم قانوني بطريقة أو بأخرى.
يقول ريان كورانا، رئيس الموظفين في شركة Wombo للذكاء الاصطناعي التوليدي، إن معظم الشركات التي تبيع هذه الخدمات تدرك هذه الاختلافات. قال عبر البريد الإلكتروني: "الاستخدام المتعمد للمطالبات التي تعتمد على الأعمال المحمية بحقوق الطبع والنشر لتوليد مخرجات [...] ينتهك شروط خدمة كل لاعب رئيسي". لكنه يضيف، "التنفيذ صعب" والشركات مهتمة أكثر بـ "التوصل إلى طرق لمنع استخدام النماذج في طرق انتهاك حقوق الطبع والنشر [...] بدلاً من تقييد بيانات التدريب". هذا صحيح بشكل خاص لنماذج تحويل النص إلى صورة مفتوحة المصدر مثل Stable Diffusion، والتي يمكن تدريبها واستخدامها بدون أي رقابة أو مرشحات. ربما تكون الشركة قد غطت ظهرها، لكنها قد تسهل أيضًا الاستخدامات التي تنتهك حقوق الطبع والنشر.
هناك متغير آخر في الحكم على الاستخدام العادل وهو ما إذا كان قد تم إنشاء بيانات ونموذج التدريب بواسطة باحثين أكاديميين ومنظمات غير ربحية أم لا. يؤدي هذا بشكل عام إلى تعزيز دفاعات الاستخدام العادل وتعرف الشركات الناشئة ذلك. لذلك، على سبيل المثال، Stability AI، الشركة التي توزع Stable Diffusion، لم تجمع بشكل مباشر بيانات تدريب النموذج أو تدرب النماذج وراء البرنامج. وبدلاً من ذلك، قامت بتمويل وتنسيق هذا العمل من قبل الأكاديميين وتم ترخيص نموذج Stable Diffusion من قبل جامعة ألمانية. يتيح هذا لـ Stability AI تحويل النموذج إلى خدمة تجارية (DreamStudio) مع الحفاظ على مسافة قانونية من إنشائه.
أطلق بايو على هذه الممارسة اسم "غسل بيانات الذكاء الاصطناعي". ويشير إلى أن هذه الطريقة قد تم استخدامها من قبل في إنشاء برنامج AI للتعرف على الوجه، ويشير إلى حالة MegaFace، وهي مجموعة بيانات قام بتجميعها باحثون من جامعة واشنطن عن طريق إزالة الصور من موقع Flickr. يقول بايو: "أخذ الباحثون الأكاديميون البيانات، وغسلوها، واستخدمتها الشركات التجارية". الآن، كما يقول، هذه البيانات - بما في ذلك ملايين الصور الشخصية - في أيدي "[شركة التعرف على الوجه] Clearview AI وإنفاذ القانون والحكومة الصينية." من المحتمل أن تساعد عملية غسيل مجربة ومختبرة على حماية منشئي نماذج الذكاء الاصطناعي التوليدية من المسؤولية أيضًا.
هناك تطور أخير لكل هذا، على الرغم من ذلك، حيث يشير جيرفيس إلى أن التفسير الحالي للاستخدام العادل قد يتغير فعليًا في الأشهر المقبلة بسبب قضية معلقة بالمحكمة العليا تشمل آندي وارهول وبرنس. تتعلق القضية باستخدام وارهول لصور برنس لإنشاء عمل فني. هل كان هذا الاستخدام العادل أم أنه انتهاك لحقوق الطبع والنشر؟
"المحكمة العليا لا تطبق الاستخدام العادل في كثير من الأحيان، لذلك عندما تفعل ذلك، فإنها عادة ما تفعل شيئًا مهمًا. أعتقد أنهم سيفعلون الشيء نفسه هنا، "يقول جيرفيس. "وقول أي شيء هو قانون مستقر أثناء انتظار المحكمة العليا لتغيير القانون أمر محفوف بالمخاطر".
كيف يمكن للفنانين وشركات الذكاء الاصطناعي صنع السلام؟
حتى إذا تبين أن تدريب نماذج الذكاء الاصطناعي التوليدية مشمول بالاستخدام العادل، فإن ذلك لن يحل مشاكل المجال. لن ترضي الفنانين الغاضبين من استخدام عملهم لتدريب النماذج التجارية، ولن يكون بالضرورة صحيحًا عبر مجالات الذكاء الاصطناعي التوليدية الأخرى، مثل الكود والموسيقى. مع وضع هذا في الاعتبار، فإن السؤال هو: ما هي العلاجات التي يمكن تقديمها، تقنية أو غير ذلك، للسماح للذكاء الاصطناعي بالازدهار مع منح الائتمان أو التعويض للمبدعين الذين يجعل عملهم هذا المجال ممكنًا؟
الاقتراح الأكثر وضوحًا هو ترخيص البيانات ودفع أجور منشئيها. بالنسبة للبعض، فإن هذا سيقتل الصناعة. يقول بريان كيسي ومارك ليملي، مؤلفا كتاب "التعليم العادل Fair Learning"، وهو بحث قانوني أصبح العمود الفقري للحجج التي تروج للاستخدام العادل للذكاء الاصطناعي التوليدي، إن مجموعات بيانات التدريب كبيرة جدًا بحيث "لا يوجد خيار معقول لمجرد ترخيص كل العناصر الأساسية الصور الفوتوغرافية أو مقاطع الفيديو أو الملفات الصوتية أو النصوص للاستخدام الجديد". وهم يجادلون بأن السماح بأي مطالبة بحقوق الطبع والنشر هو "بمثابة قول، ليس أن مالكي حقوق الطبع والنشر سيتقاضون رواتبهم، ولكن لن يُسمح بهذا الاستخدام على الإطلاق". إن السماح بـ "التعلم العادل"، كما يؤطرونه، لا يشجع الابتكار فحسب، بل يسمح أيضًا بتطوير أنظمة ذكاء اصطناعي أفضل.
ومع ذلك، يشير آخرون إلى أننا قد بحثنا بالفعل في قضايا حقوق الطبع والنشر ذات الحجم المقارن والتعقيد ويمكننا القيام بذلك مرة أخرى. كانت المقارنة التي أثارها العديد من الخبراء هي عصر قرصنة الموسيقى، عندما تم إنشاء برامج مشاركة الملفات على خلفية انتهاك حقوق النشر الهائل وازدهرت فقط حتى كانت هناك تحديات قانونية أدت إلى اتفاقيات جديدة تحترم حقوق النشر.
"لذلك، في أوائل العقد الأول من القرن الحالي، كان لديك نابستر، الذي أحبه الجميع ولكنه كان غير قانوني تمامًا. واليوم، لدينا أشياء مثل Spotify و iTunes، "قال ماثيو باتريك، المحامي الذي يقاضي حاليًا الشركات لإلغاء البيانات لتدريب نماذج الذكاء الاصطناعي، في وقت سابق من هذا الشهر. وكيف نشأت هذه الأنظمة؟ من خلال الشركات التي تعقد صفقات الترخيص وجلب المحتوى بشكل شرعي. جاء جميع أصحاب المصلحة إلى طاولة المفاوضات وجعلوها تعمل، والفكرة القائلة بأن شيئًا مشابهًا لا يمكن أن يحدث للذكاء الاصطناعي هي، بالنسبة لي، كارثية بعض الشيء".
وتوقع ريان كورانا من Wombo نتيجة مماثلة. وقال: "تتمتع الموسيقى إلى حد بعيد بقواعد حقوق التأليف والنشر الأكثر تعقيدًا بسبب الأنواع المختلفة للترخيص وتنوع أصحاب الحقوق والوسطاء المتعددين المعنيين". "بالنظر إلى الفروق الدقيقة [في الأسئلة القانونية المحيطة بالذكاء الاصطناعي]، أعتقد أن المجال التوليدي بأكمله سيتطور إلى نظام ترخيص مشابه لنظام الموسيقى".
كما يتم تجربة بدائل أخرى. يقول Shutterstock، على سبيل المثال، إنه يخطط لإنشاء صندوق لتعويض الأفراد الذين يتم بيع عملهم لشركات الذكاء الاصطناعي لتدريب نماذجهم، بينما أنشأت DeviantArt علامة بيانات وصفية للصور التي يتم مشاركتها على الويب والتي تحذر باحثي الذكاء الاصطناعي من التخلص من محتواها . (قامت شبكة اجتماعية صغيرة واحدة على الأقل، Cohost، بتبني العلامة عبر موقعها وتقول إن وجدت أن الباحثين يقومون بكشط صورها بغض النظر عن ذلك، "لن تستبعد اتخاذ إجراء قانوني"). مع المجتمعات الفنية المختلطة. هل يمكن أن تعوض رسوم الترخيص لمرة واحدة عن فقدان سبل العيش؟ وكيف تساعد علامة no-scraping التي تم نشرها الآن الفنانين الذين تم استخدام عملهم بالفعل لتدريب نظام الذكاء الاصطناعي التجاري؟
بالنسبة للعديد من المبدعين، يبدو أن الضرر قد حدث بالفعل. لكن الشركات الناشئة في مجال الذكاء الاصطناعي تقترح على الأقل مناهج جديدة للمستقبل. تتمثل إحدى الخطوات الواضحة إلى الأمام في قيام باحثي الذكاء الاصطناعي ببساطة بإنشاء قواعد بيانات حيث لا توجد إمكانية لانتهاك حقوق الطبع والنشر - إما لأن المادة قد تم ترخيصها بشكل صحيح أو لأنها تم إنشاؤها لغرض محدد من تدريب الذكاء الاصطناعي. أحد الأمثلة على ذلك هو "The Stack" - مجموعة بيانات لتدريب الذكاء الاصطناعي مصممة خصيصًا لتجنب الاتهامات بانتهاك حقوق النشر. فهو لا يتضمن سوى التعليمات البرمجية التي تحتوي على أكثر تراخيص مفتوحة المصدر تساهلاً قدر الإمكان وتوفر للمطورين طريقة سهلة لإزالة بياناتهم عند الطلب. يقول مبتكروها إنه يمكن استخدام نموذجهم في جميع أنحاء الصناعة.
قال ياسين جيرنيت، رئيس التعلم الآلي والمجتمع في Hugging Face، والذي ساعد في إنشاء The Stack بالتعاون مع شريك ServiceNow: "يمكن تكييف نهج Stack تمامًا مع الوسائط الأخرى". "إنها خطوة أولى مهمة في استكشاف مجموعة واسعة من الآليات الموجودة للموافقة - الآليات التي تعمل في أفضل حالاتها عندما تأخذ قواعد النظام الأساسي التي تم استخراج بيانات تدريب الذكاء الاصطناعي منها في الاعتبار." يقول جيرنايت إن Hugging Face تريد المساعدة في إحداث "تحول جذري" في كيفية تعامل الباحثين في الذكاء الاصطناعي مع المبدعين. لكن حتى الآن، لا يزال نهج الشركة نادرًا.
ماذا سيحدث بعد ذلك؟
بغض النظر عن المكان الذي نصل إليه في هذه الأسئلة القانونية، فإن الجهات الفاعلة المختلفة في مجال الذكاء الاصطناعي التوليدي تستعد بالفعل ... شيء ما. تعمل الشركات التي تكسب الملايين من هذه التكنولوجيا على ترسيخ نفسها: تعلن مرارًا وتكرارًا أن كل ما تفعله قانوني (بينما من المفترض أن لا يطعن أحد في هذا الادعاء). على الجانب الآخر من الأرض الحرام، يطرح أصحاب حقوق الطبع والنشر مواقفهم المؤقتة دون أن يلزموا أنفسهم باتخاذ إجراء. حظرت Getty Images مؤخرًا محتوى الذكاء الاصطناعي بسبب المخاطر القانونية المحتملة على العملاء ("لا أعتقد أنه مسؤول. أعتقد أنه قد يكون غير قانوني"، صرح بذلك الرئيس التنفيذي كريج بيترز الشهر الماضي) بينما أعلنت مؤسسة تجارة الموسيقى RIAA أن الذكاء الاصطناعي آلات مزج الموسيقى والمستخرجون التي تعمل بالطاقة تنتهك حقوق الطبع والنشر للأعضاء (على الرغم من أنهم لم يذهبوا إلى حد إطلاق أي تحديات قانونية فعلية).
تم بالفعل إطلاق الطلقة الأولى في حروب حقوق الطبع والنشر للذكاء الاصطناعي، مع إطلاق دعوى قضائية جماعية مقترحة الأسبوع الماضي ضد Microsoft و GitHub و OpenAI. تتهم القضية جميع الشركات الثلاث بإعادة إنتاج كود مفتوح المصدر عن قصد من خلال مساعد ترميز AI، Copilot، ولكن بدون التراخيص المناسبة. في حديثهم الأسبوع الماضي، قال المحامون الذين يقفون وراء الدعوى إنها يمكن أن تشكل سابقة لمجال الذكاء الاصطناعي التوليدي بأكمله (على الرغم من أن الخبراء الآخرين عارضوا ذلك، قائلين إن أي تحديات تتعلق بحقوق النشر تتضمن رمزًا من المحتمل أن تكون منفصلة عن تلك التي تتضمن محتوى مثل الفن والموسيقى) .
في غضون ذلك، قال كل من Guadamuz و Baio إنهما متفاجئان من عدم وجود المزيد من التحديات القانونية حتى الآن. يقول Guadamuz "بصراحة، أنا مندهش". "ولكن أعتقد أن هذا يرجع جزئيًا إلى أن هذه الصناعات تخشى أن تكون أول من [تقاضي] وتفقد القرار. بمجرد أن يكسر شخص ما الغطاء، أعتقد أن الدعاوى القضائية ستبدأ في التحليق إلى اليسار واليمين".
اقترح بايو أن إحدى الصعوبات تتمثل في أن العديد من الأشخاص الأكثر تأثراً بهذه التكنولوجيا - الفنانين وما شابه - ليسوا ببساطة في وضع جيد لإطلاق تحديات قانونية. يقول: "ليس لديهم الموارد". "هذا النوع من التقاضي مكلف للغاية ويستغرق وقتًا طويلاً، ولن تفعل ذلك إلا إذا كنت تعلم أنك ستفوز. هذا هو السبب في أنني اعتقدت لبعض الوقت أن أولى الدعاوى القضائية المتعلقة بفن الذكاء الاصطناعي ستكون من مواقع الصور المخزنة. يبدو أنهم على وشك أن يخسروا أكثر من هذه التكنولوجيا، يمكنهم بوضوح إثبات أن قدرًا كبيرًا من مجموعاتهم تم استخدامه لتدريب هذه النماذج، ولديهم التمويل اللازم لرفعها إلى المحكمة".
يوافق جواداموز. يقول: "الكل يعرف كم ستكون باهظة الثمن". "أي شخص يقاضي سيحصل على قرار في المحاكم الأدنى، ثم يستأنف، ثم يستأنف مرة أخرى، وفي النهاية، يمكن أن يذهب إلى المحكمة العليا".