مؤتمر التعلم الآلي (machine learning conference) الذي يناقش استخدام التعلم الآلي؟ في حين أن هذا قد يبدو ميتا، في دعوته لتقديم الأوراق الورقية يوم الاثنين، لاحظ المؤتمر الدولي للتعلم الآلي بالفعل أن "الأوراق التي تتضمن نصًا تم إنشاؤه من نموذج لغوي واسع النطاق (LLM) Large-scale Language Model مثل ChatGPT محظورة ما لم يتم تقديم النص الناتج كجزء من التحليل التجريبي للورقة".
لم يستغرق نقاشًا سريعًا على وسائل التواصل الاجتماعي وقتًا طويلاً حتى يتشكل، فيما قد يكون مثالًا مثاليًا لما يجب على الشركات والمنظمات والمؤسسات من جميع الأشكال والأحجام، عبر القطاعات، أن تتعامل مع المضي قدمًا: كيف سيتعامل البشر مع ظهور نماذج اللغة الكبيرة التي يمكن أن تساعد في التواصل - أو الاقتراض، أو التوسع، أو الانتحال، اعتمادًا على وجهة نظرك - الأفكار؟
الحجج المؤيدة والمعارضة لاستخدام ChatGPT
مع ازدياد صوت النقاش على Twitter خلال اليومين الماضيين، ظهرت مجموعة متنوعة من الحجج المؤيدة والمعارضة لاستخدام LLMs في عمليات تقديم أوراق ML.
غرد Yann LeCun، كبير علماء الذكاء الاصطناعي في Meta: "نماذج اللغة المتوسطة والصغيرة الحجم جيدة، أليس كذلك؟"، مضيفًا، "أنا أسأل فقط، كما تعلمون ... المدققات الإملائية ولوحات المفاتيح التنبؤية هي نماذج لغوية".
ووصف سيباستيان بوبيك، الذي يقود فريق مؤسسة ML في Microsoft Research، القاعدة بأنها "قصيرة النظر Shortsighted"، حيث غرد أن: "ChatGPT والمتغيرات جزء من المستقبل. الحظر بالتأكيد ليس الحل".
غرد إيثان بيريز، الباحث في منظمة Anthropic AI، قائلاً: "تؤثر هذه القاعدة بشكل غير متناسب على المتعاونين معي الذين ليسوا متحدثين أصليين للغة الإنجليزية".
وافقت سيلفيا سيلان، المرشحة لنيل درجة الدكتوراه في معالجة الرسومات والرسومات الهندسية بجامعة تورنتو، على تويتر قائلة: "في محاولة لمنح رؤساء المؤتمر ميزة الشك، لكنني حقًا لا أفهم هذا الحظر الشامل. كما أفهمها، فإن LLM، مثل Photoshop أو مساعد الطيار GitHub، هي أداة يمكن أن يكون لها كل من شرعية (على سبيل المثال، أنا أستخدمها كمتحدث للغة الإنجليزية لغير الناطقين بها) والاستخدامات الشائنة ..."
مؤتمر ICML يستجيب لقواعد أخلاقيات LLM
أخيرًا، أوضح ICML أمس سياسة أخلاقيات LLM الخاصة به:
"لقد أدرجنا (رؤساء البرامج) البيان التالي في دعوة تقديم الأوراق لـ ICML الممثلة بحلول عام 2023:
"الأوراق التي تتضمن نصًا تم إنشاؤه من نموذج لغة واسع النطاق (LLM) مثل ChatGPT محظورة ما لم يتم تقديم النص الناتج كجزء من التحليل التجريبي للورقة".
"أثار هذا البيان عددًا من الأسئلة من المؤلفين المحتملين وقاد البعض إلى التواصل معنا بشكل استباقي. نحن نقدر ملاحظاتك وتعليقاتك ونود أن نوضح بشكل أكبر النية من وراء هذا البيان وكيف نخطط لتنفيذ هذه السياسة لـ ICML 2023".
وأوضح الرد أن:
- "تحظر سياسة نموذج اللغة الكبيرة (LLM) لـ ICML 2023 النص الذي تم إنتاجه بالكامل بواسطة LLM (أي" تم إنشاؤه "). هذا لا يمنع المؤلفين من استخدام LLM لتحرير أو تلميع النص المكتوب من قبل المؤلف.
- تعتمد سياسة LLM إلى حد كبير على مبدأ التحفظ فيما يتعلق بالحماية من المشكلات المحتملة لاستخدام LLM، بما في ذلك الانتحال.
- تنطبق سياسة LLM على ICML 2023. نتوقع أن تتطور هذه السياسة في المؤتمرات المستقبلية لأننا نفهم LLM وتأثيراتها على النشر العلمي بشكل أفضل".
وقال البيان إن التقدم السريع في LLMs مثل ChatGPT، "غالبًا ما يأتي بعواقب غير متوقعة بالإضافة إلى أسئلة بدون إجابة"، بما في ذلك ما إذا كان النص الذي تم إنشاؤه يعتبر جديدًا أو مشتقًا، بالإضافة إلى قضايا تتعلق بالملكية.
وقال البيان: "من المؤكد أن هذه الأسئلة، وغيرها الكثير، ستتم الإجابة عليها بمرور الوقت، حيث يتم اعتماد هذه النماذج التوليدية واسعة النطاق على نطاق واسع". "ومع ذلك، ليس لدينا حتى الآن أي إجابات واضحة على أي من هذه الأسئلة".
ماذا عن استخدام إسناد ChatGPT؟
وافقت مارجريت ميتشل، كبيرة علماء الأخلاقيات في Hugging Face، على أن هناك قلقًا أساسيًا بشأن الانتحال، لكنها اقترحت تنحية هذه الحجة جانبًا، لأن "ما يعتبر سرقة أدبية" يستحق "مناقشته الخاصة".
ومع ذلك، رفضت الحجج القائلة بأن ChatGPT ليس مؤلفًا، ولكنه أداة.
قالت: "مع الكثير من الغضب، أعتقد أن هذا انقسام خاطئ (لا يستبعد أحدهما الآخر: يمكن أن يكون كلاهما) ويبدو لي ارتباكًا مزيفًا عن قصد لتحريف حقيقة أنها أداة مؤلفة من محتوى مؤلف من قبل المؤلفين".
بالانتقال من الحجج، تعتقد أن استخدام أدوات LLM مع الإسناد يمكن أن يعالج مخاوف ICML.
"بالنسبة إلى وجهة نظرك حول هذه الأنظمة التي تساعد في الكتابة من قبل متحدثين غير أصليين، هناك أسباب وجيهة جدًا للقيام بعكس ما يفعله ICML: الدعوة لاستخدام هذه الأدوات لدعم المساواة والإنصاف بين الباحثين ذوي القدرات الكتابية المختلفة و الأنماط، أوضحت".
وتابعت قائلة: "نظرًا لأن لدينا بعض القواعد المتعلقة بالاعتراف بمساهمات أشخاص محددين تم إنشاؤها بالفعل، فليس من الصعب جدًا توسيع هذه القواعد لتشمل أنظمة مستمدة من العديد من الأشخاص". "يمكن إدراج أداة مثل ChatGPT على أنها شيء مثل مؤلف أو نظير معترف به".
يتمثل الاختلاف الأساسي في عزو ChatGPT (والنماذج المماثلة) في أنه في هذه المرحلة، لا يمكن التعرف على الأشخاص الفريدين - يمكن عزو النظام فقط. وقالت: "لذلك من المنطقي تطوير استراتيجيات للإسناد تأخذ ذلك في الاعتبار". "لا يلزم أن تكون ChatGPT والنماذج المماثلة مؤلفًا مدرجًا بالمعنى التقليدي. يمكن أن يكون إسناد المؤلف (على سبيل المثال) حاشية سفلية على الصفحة الرئيسية (على غرار الملاحظات على الانتماءات)، أو نوعًا جديدًا مخصصًا من السطر الثانوي، أو <إلخ".
لم يستغرق نقاشًا سريعًا على وسائل التواصل الاجتماعي وقتًا طويلاً حتى يتشكل، فيما قد يكون مثالًا مثاليًا لما يجب على الشركات والمنظمات والمؤسسات من جميع الأشكال والأحجام، عبر القطاعات، أن تتعامل مع المضي قدمًا: كيف سيتعامل البشر مع ظهور نماذج اللغة الكبيرة التي يمكن أن تساعد في التواصل - أو الاقتراض، أو التوسع، أو الانتحال، اعتمادًا على وجهة نظرك - الأفكار؟
الحجج المؤيدة والمعارضة لاستخدام ChatGPT
مع ازدياد صوت النقاش على Twitter خلال اليومين الماضيين، ظهرت مجموعة متنوعة من الحجج المؤيدة والمعارضة لاستخدام LLMs في عمليات تقديم أوراق ML.
غرد Yann LeCun، كبير علماء الذكاء الاصطناعي في Meta: "نماذج اللغة المتوسطة والصغيرة الحجم جيدة، أليس كذلك؟"، مضيفًا، "أنا أسأل فقط، كما تعلمون ... المدققات الإملائية ولوحات المفاتيح التنبؤية هي نماذج لغوية".
ووصف سيباستيان بوبيك، الذي يقود فريق مؤسسة ML في Microsoft Research، القاعدة بأنها "قصيرة النظر Shortsighted"، حيث غرد أن: "ChatGPT والمتغيرات جزء من المستقبل. الحظر بالتأكيد ليس الحل".
غرد إيثان بيريز، الباحث في منظمة Anthropic AI، قائلاً: "تؤثر هذه القاعدة بشكل غير متناسب على المتعاونين معي الذين ليسوا متحدثين أصليين للغة الإنجليزية".
وافقت سيلفيا سيلان، المرشحة لنيل درجة الدكتوراه في معالجة الرسومات والرسومات الهندسية بجامعة تورنتو، على تويتر قائلة: "في محاولة لمنح رؤساء المؤتمر ميزة الشك، لكنني حقًا لا أفهم هذا الحظر الشامل. كما أفهمها، فإن LLM، مثل Photoshop أو مساعد الطيار GitHub، هي أداة يمكن أن يكون لها كل من شرعية (على سبيل المثال، أنا أستخدمها كمتحدث للغة الإنجليزية لغير الناطقين بها) والاستخدامات الشائنة ..."
مؤتمر ICML يستجيب لقواعد أخلاقيات LLM
أخيرًا، أوضح ICML أمس سياسة أخلاقيات LLM الخاصة به:
"لقد أدرجنا (رؤساء البرامج) البيان التالي في دعوة تقديم الأوراق لـ ICML الممثلة بحلول عام 2023:
"الأوراق التي تتضمن نصًا تم إنشاؤه من نموذج لغة واسع النطاق (LLM) مثل ChatGPT محظورة ما لم يتم تقديم النص الناتج كجزء من التحليل التجريبي للورقة".
"أثار هذا البيان عددًا من الأسئلة من المؤلفين المحتملين وقاد البعض إلى التواصل معنا بشكل استباقي. نحن نقدر ملاحظاتك وتعليقاتك ونود أن نوضح بشكل أكبر النية من وراء هذا البيان وكيف نخطط لتنفيذ هذه السياسة لـ ICML 2023".
وأوضح الرد أن:
- "تحظر سياسة نموذج اللغة الكبيرة (LLM) لـ ICML 2023 النص الذي تم إنتاجه بالكامل بواسطة LLM (أي" تم إنشاؤه "). هذا لا يمنع المؤلفين من استخدام LLM لتحرير أو تلميع النص المكتوب من قبل المؤلف.
- تعتمد سياسة LLM إلى حد كبير على مبدأ التحفظ فيما يتعلق بالحماية من المشكلات المحتملة لاستخدام LLM، بما في ذلك الانتحال.
- تنطبق سياسة LLM على ICML 2023. نتوقع أن تتطور هذه السياسة في المؤتمرات المستقبلية لأننا نفهم LLM وتأثيراتها على النشر العلمي بشكل أفضل".
وقال البيان إن التقدم السريع في LLMs مثل ChatGPT، "غالبًا ما يأتي بعواقب غير متوقعة بالإضافة إلى أسئلة بدون إجابة"، بما في ذلك ما إذا كان النص الذي تم إنشاؤه يعتبر جديدًا أو مشتقًا، بالإضافة إلى قضايا تتعلق بالملكية.
وقال البيان: "من المؤكد أن هذه الأسئلة، وغيرها الكثير، ستتم الإجابة عليها بمرور الوقت، حيث يتم اعتماد هذه النماذج التوليدية واسعة النطاق على نطاق واسع". "ومع ذلك، ليس لدينا حتى الآن أي إجابات واضحة على أي من هذه الأسئلة".
ماذا عن استخدام إسناد ChatGPT؟
وافقت مارجريت ميتشل، كبيرة علماء الأخلاقيات في Hugging Face، على أن هناك قلقًا أساسيًا بشأن الانتحال، لكنها اقترحت تنحية هذه الحجة جانبًا، لأن "ما يعتبر سرقة أدبية" يستحق "مناقشته الخاصة".
ومع ذلك، رفضت الحجج القائلة بأن ChatGPT ليس مؤلفًا، ولكنه أداة.
قالت: "مع الكثير من الغضب، أعتقد أن هذا انقسام خاطئ (لا يستبعد أحدهما الآخر: يمكن أن يكون كلاهما) ويبدو لي ارتباكًا مزيفًا عن قصد لتحريف حقيقة أنها أداة مؤلفة من محتوى مؤلف من قبل المؤلفين".
بالانتقال من الحجج، تعتقد أن استخدام أدوات LLM مع الإسناد يمكن أن يعالج مخاوف ICML.
"بالنسبة إلى وجهة نظرك حول هذه الأنظمة التي تساعد في الكتابة من قبل متحدثين غير أصليين، هناك أسباب وجيهة جدًا للقيام بعكس ما يفعله ICML: الدعوة لاستخدام هذه الأدوات لدعم المساواة والإنصاف بين الباحثين ذوي القدرات الكتابية المختلفة و الأنماط، أوضحت".
وتابعت قائلة: "نظرًا لأن لدينا بعض القواعد المتعلقة بالاعتراف بمساهمات أشخاص محددين تم إنشاؤها بالفعل، فليس من الصعب جدًا توسيع هذه القواعد لتشمل أنظمة مستمدة من العديد من الأشخاص". "يمكن إدراج أداة مثل ChatGPT على أنها شيء مثل مؤلف أو نظير معترف به".
يتمثل الاختلاف الأساسي في عزو ChatGPT (والنماذج المماثلة) في أنه في هذه المرحلة، لا يمكن التعرف على الأشخاص الفريدين - يمكن عزو النظام فقط. وقالت: "لذلك من المنطقي تطوير استراتيجيات للإسناد تأخذ ذلك في الاعتبار". "لا يلزم أن تكون ChatGPT والنماذج المماثلة مؤلفًا مدرجًا بالمعنى التقليدي. يمكن أن يكون إسناد المؤلف (على سبيل المثال) حاشية سفلية على الصفحة الرئيسية (على غرار الملاحظات على الانتماءات)، أو نوعًا جديدًا مخصصًا من السطر الثانوي، أو <إلخ".
تتصارع مع مستقبل مدعوم من LLM
في نهاية المطاف، قالت ميتشل، لا يحتاج مجتمع ML إلى التراجع عن طريق الطريقة التقليدية التي ننظر بها إلى المؤلفين.
قالت: "العالم هو محارنا في كيفية التعرف على هذه الأدوات الجديدة ونسبها لها".
هل سيكون هذا صحيحًا حيث تبدأ المنظمات والمؤسسات الأخرى غير التابعة لـ non-ML في التعامل مع هذه المشكلات نفسها؟