قد تكون أنظمة الذكاء الاصطناعي Artificial intelligence systems قادرة على إكمال المهام بسرعة، لكن هذا لا يعني أنها تقوم بذلك دائمًا بشكل عادل. إذا كانت مجموعات البيانات المستخدمة لتدريب نماذج التعلم الآلي machine-learning models تحتوي على بيانات متحيزة، فمن المحتمل أن يظهر النظام نفس التحيز عند اتخاذ القرارات في الممارسة العملية.
على سبيل المثال، إذا كانت مجموعة البيانات تحتوي في الغالب على صور لرجال بيض، فقد يكون نموذج التعرف على الوجه المُدرب بهذه البيانات أقل دقة بالنسبة للنساء أو الأشخاص ذوي درجات البشرة المختلفة.
سعت مجموعة من الباحثين في معهد ماساتشوستس للتكنولوجيا MIT، بالتعاون مع باحثين في جامعة هارفارد وشركة فوجيتسو Fujitsu المحدودة، إلى فهم متى وكيف يكون نموذج التعلم الآلي قادرًا على التغلب على هذا النوع من تحيز مجموعة البيانات. استخدموا نهجًا من علم الأعصاب لدراسة كيفية تأثير بيانات التدريب على ما إذا كانت الشبكة العصبية neural network الاصطناعية يمكن أن تتعلم التعرف على الأشياء التي لم ترها من قبل. الشبكة العصبية هي نموذج للتعلم الآلي يحاكي الدماغ البشري بالطريقة التي يحتوي بها طبقات من العقد المترابطة interconnected nodes، أو "الخلايا العصبية neurons" ، التي تعالج البيانات.
تظهر النتائج الجديدة أن التنوع في بيانات التدريب له تأثير كبير على ما إذا كانت الشبكة العصبية قادرة على التغلب على التحيز bias، ولكن في نفس الوقت يمكن أن يؤدي تنوع مجموعة البيانات إلى تدهور أداء الشبكة. كما يوضحون أيضًا أن كيفية تدريب الشبكة العصبية، وأنواع معينة من الخلايا العصبية التي تظهر أثناء عملية التدريب، يمكن أن تلعب دورًا رئيسيًا في ما إذا كانت قادرة على التغلب على مجموعة البيانات المتحيزة.
"يمكن للشبكة العصبية أن تتغلب على تحيز مجموعة البيانات، وهو أمر مشجع. ولكن المهم هنا هو أننا بحاجة إلى مراعاة تنوع البيانات. نحتاج إلى التوقف عن التفكير في أنه إذا جمعت عددًا كبيرًا من البيانات الأولية، فسيحصل ذلك على أنت في مكان ما. نحن بحاجة إلى توخي الحذر الشديد بشأن كيفية تصميم مجموعات البيانات في المقام الأول"، كما يقول Xavier Boix، عالم الأبحاث في قسم علوم الدماغ والمعرفة (BCS) Brain and Cognitive Sciences ومركز الأدمغة والعقول والآلات (CBMM) Center for Brains, Minds, and Machines، وكبير مؤلفي الورقة.
يشمل المؤلفون المشاركون طلاب الدراسات العليا السابقين Spandan Madan، وهو مؤلف مناظر يسعى حاليًا للحصول على درجة الدكتوراه. في هارفارد Harvard، وTimothy Henry، وJamell Dozier، وHelen Ho، وNishchal Bhandari؛ وTomotake Sasaki، عالم زائر سابق يعمل الآن باحثًا في Fujitsu؛ وFrédo Durand، أستاذ الهندسة الكهربائية وعلوم الكمبيوتر وعضو مختبر علوم الكمبيوتر والذكاء الاصطناعي؛ وHanspeter Pfister، أستاذ لعلوم الكمبيوتر في كلية هارفارد للهندسة والعلوم التطبيقية.
يفكر مثل عالم الأعصاب Thinking like a neuroscientist
تعامل Boix وزملاؤه مع مشكلة تحيز مجموعة البيانات بالتفكير مثل علماء الأعصاب. يوضح Boix أنه في علم الأعصاب، من الشائع استخدام مجموعات البيانات الخاضعة للرقابة في التجارب، مما يعني مجموعة البيانات التي يعرف الباحثون فيها قدر الإمكان عن المعلومات التي تحتوي عليها.
قام الفريق ببناء مجموعات بيانات تحتوي على صور لأجسام مختلفة في أوضاع مختلفة، وتحكم بعناية في التركيبات، لذا فإن بعض مجموعات البيانات لديها تنوع أكبر من غيرها. في هذه الحالة، كانت مجموعة البيانات أقل تنوعًا إذا كانت تحتوي على المزيد من الصور التي تُظهر الكائنات من وجهة نظر واحدة فقط. تحتوي مجموعة البيانات الأكثر تنوعًا على المزيد من الصور التي تعرض كائنات من وجهات نظر متعددة. احتوت كل مجموعة بيانات على نفس عدد الصور.
استخدم الباحثون مجموعات البيانات هذه التي تم إنشاؤها بعناية لتدريب شبكة عصبية لتصنيف الصور، ثم درسوا مدى قدرتها على تحديد الأشياء من وجهات النظر التي لم تراها الشبكة أثناء التدريب (المعروفة باسم مجموعة خارج التوزيع).
على سبيل المثال، إذا كان الباحثون يدربون نموذجًا لتصنيف السيارات في الصور، فإنهم يريدون أن يتعلم النموذج كيف تبدو السيارات المختلفة. ولكن إذا تم عرض كل سيارة Ford Thunderbird في مجموعة بيانات التدريب من الأمام، فعندما يُعطى النموذج المدرب صورة لقطة Ford Thunderbird من الجانب، فقد يصنفها بشكل خاطئ، حتى لو تم تدريبها على ملايين الصور الخاصة بالسيارات.
وجد الباحثون أنه إذا كانت مجموعة البيانات أكثر تنوعًا- إذا أظهر المزيد من الصور كائنات من وجهات نظر مختلفة- فإن الشبكة تكون أكثر قدرة على التعميم على الصور أو وجهات النظر الجديدة. يقول بويكس إن تنوع البيانات هو مفتاح التغلب على التحيز.
يقول: "لكن الأمر لا يعني أن المزيد من تنوع البيانات هو الأفضل دائمًا؛ فهناك توتر هنا. عندما تتحسن الشبكة العصبية في التعرف على الأشياء الجديدة التي لم تراها، سيصبح من الصعب عليها التعرف على الأشياء التي شاهدتها بالفعل".
اختبار طرق التدريب Testing training methods
كما درس الباحثون طرق تدريب الشبكة العصبية.
في التعلم الآلي، من الشائع تدريب شبكة لأداء مهام متعددة في نفس الوقت. الفكرة هي أنه في حالة وجود علاقة بين المهام، ستتعلم الشبكة أداء كل مهمة بشكل أفضل إذا تعلمتها معًا.
لكن الباحثين وجدوا أن العكس هو الصحيح- فالنموذج الذي تم تدريبه بشكل منفصل لكل مهمة كان قادرًا على التغلب على التحيز بشكل أفضل بكثير من النموذج الذي تم تدريبه لكلا المهمتين معًا.
يقول: "كانت النتائج مذهلة حقًا. في الواقع، في المرة الأولى التي أجرينا فيها هذه التجربة، اعتقدنا أنها خطأ. استغرق الأمر منا عدة أسابيع لندرك أنها كانت نتيجة حقيقية لأنها كانت غير متوقعة".
لقد تعمقوا في عمق الشبكات العصبية لفهم سبب حدوث ذلك.
وجدوا أن تخصص الخلايا العصبية يبدو أنه يلعب دورًا رئيسيًا. عندما يتم تدريب الشبكة العصبية على التعرف على الأشياء في الصور، يظهر أن نوعين من الخلايا العصبية يظهران- أحدهما متخصص في التعرف على فئة الكائن والآخر متخصص في التعرف على وجهة النظر.
يوضح Boix أنه عندما يتم تدريب الشبكة على أداء المهام بشكل منفصل، تكون تلك الخلايا العصبية المتخصصة أكثر بروزًا. ولكن إذا تم تدريب الشبكة على القيام بكلتا المهمتين في وقت واحد، فإن بعض الخلايا العصبية تصبح مخففة ولا تتخصص في مهمة واحدة. ويقول إن هذه الخلايا العصبية غير المتخصصة أكثر عرضة للارتباك.
يقول: "لكن السؤال التالي الآن، كيف وصلت هذه الخلايا العصبية إلى هناك؟ أنت تدرب الشبكة العصبية وتخرج من عملية التعلم. لم يخبر أحد الشبكة بتضمين هذه الأنواع من الخلايا العصبية في بنيتها. هذا هو الشيء الرائع".
هذا هو أحد المجالات التي يأمل الباحثون استكشافها مع العمل في المستقبل. يريدون معرفة ما إذا كان بإمكانهم إجبار شبكة عصبية على تطوير خلايا عصبية بهذا التخصص. يريدون أيضًا تطبيق نهجهم على المهام الأكثر تعقيدًا ، مثل الكائنات ذات الأنسجة المعقدة أو الإضاءة المتنوعة.
يرجح Boix أن الشبكة العصبية يمكن أن تتعلم التغلب على التحيز، وهو يأمل أن يلهم عملهم الآخرين ليكونوا أكثر تفكيرًا بشأن مجموعات البيانات التي يستخدمونها في تطبيقات الذكاء الاصطناعي.
على سبيل المثال، إذا كانت مجموعة البيانات تحتوي في الغالب على صور لرجال بيض، فقد يكون نموذج التعرف على الوجه المُدرب بهذه البيانات أقل دقة بالنسبة للنساء أو الأشخاص ذوي درجات البشرة المختلفة.
سعت مجموعة من الباحثين في معهد ماساتشوستس للتكنولوجيا MIT، بالتعاون مع باحثين في جامعة هارفارد وشركة فوجيتسو Fujitsu المحدودة، إلى فهم متى وكيف يكون نموذج التعلم الآلي قادرًا على التغلب على هذا النوع من تحيز مجموعة البيانات. استخدموا نهجًا من علم الأعصاب لدراسة كيفية تأثير بيانات التدريب على ما إذا كانت الشبكة العصبية neural network الاصطناعية يمكن أن تتعلم التعرف على الأشياء التي لم ترها من قبل. الشبكة العصبية هي نموذج للتعلم الآلي يحاكي الدماغ البشري بالطريقة التي يحتوي بها طبقات من العقد المترابطة interconnected nodes، أو "الخلايا العصبية neurons" ، التي تعالج البيانات.
تظهر النتائج الجديدة أن التنوع في بيانات التدريب له تأثير كبير على ما إذا كانت الشبكة العصبية قادرة على التغلب على التحيز bias، ولكن في نفس الوقت يمكن أن يؤدي تنوع مجموعة البيانات إلى تدهور أداء الشبكة. كما يوضحون أيضًا أن كيفية تدريب الشبكة العصبية، وأنواع معينة من الخلايا العصبية التي تظهر أثناء عملية التدريب، يمكن أن تلعب دورًا رئيسيًا في ما إذا كانت قادرة على التغلب على مجموعة البيانات المتحيزة.
"يمكن للشبكة العصبية أن تتغلب على تحيز مجموعة البيانات، وهو أمر مشجع. ولكن المهم هنا هو أننا بحاجة إلى مراعاة تنوع البيانات. نحتاج إلى التوقف عن التفكير في أنه إذا جمعت عددًا كبيرًا من البيانات الأولية، فسيحصل ذلك على أنت في مكان ما. نحن بحاجة إلى توخي الحذر الشديد بشأن كيفية تصميم مجموعات البيانات في المقام الأول"، كما يقول Xavier Boix، عالم الأبحاث في قسم علوم الدماغ والمعرفة (BCS) Brain and Cognitive Sciences ومركز الأدمغة والعقول والآلات (CBMM) Center for Brains, Minds, and Machines، وكبير مؤلفي الورقة.
يشمل المؤلفون المشاركون طلاب الدراسات العليا السابقين Spandan Madan، وهو مؤلف مناظر يسعى حاليًا للحصول على درجة الدكتوراه. في هارفارد Harvard، وTimothy Henry، وJamell Dozier، وHelen Ho، وNishchal Bhandari؛ وTomotake Sasaki، عالم زائر سابق يعمل الآن باحثًا في Fujitsu؛ وFrédo Durand، أستاذ الهندسة الكهربائية وعلوم الكمبيوتر وعضو مختبر علوم الكمبيوتر والذكاء الاصطناعي؛ وHanspeter Pfister، أستاذ لعلوم الكمبيوتر في كلية هارفارد للهندسة والعلوم التطبيقية.
يفكر مثل عالم الأعصاب Thinking like a neuroscientist
تعامل Boix وزملاؤه مع مشكلة تحيز مجموعة البيانات بالتفكير مثل علماء الأعصاب. يوضح Boix أنه في علم الأعصاب، من الشائع استخدام مجموعات البيانات الخاضعة للرقابة في التجارب، مما يعني مجموعة البيانات التي يعرف الباحثون فيها قدر الإمكان عن المعلومات التي تحتوي عليها.
قام الفريق ببناء مجموعات بيانات تحتوي على صور لأجسام مختلفة في أوضاع مختلفة، وتحكم بعناية في التركيبات، لذا فإن بعض مجموعات البيانات لديها تنوع أكبر من غيرها. في هذه الحالة، كانت مجموعة البيانات أقل تنوعًا إذا كانت تحتوي على المزيد من الصور التي تُظهر الكائنات من وجهة نظر واحدة فقط. تحتوي مجموعة البيانات الأكثر تنوعًا على المزيد من الصور التي تعرض كائنات من وجهات نظر متعددة. احتوت كل مجموعة بيانات على نفس عدد الصور.
استخدم الباحثون مجموعات البيانات هذه التي تم إنشاؤها بعناية لتدريب شبكة عصبية لتصنيف الصور، ثم درسوا مدى قدرتها على تحديد الأشياء من وجهات النظر التي لم تراها الشبكة أثناء التدريب (المعروفة باسم مجموعة خارج التوزيع).
على سبيل المثال، إذا كان الباحثون يدربون نموذجًا لتصنيف السيارات في الصور، فإنهم يريدون أن يتعلم النموذج كيف تبدو السيارات المختلفة. ولكن إذا تم عرض كل سيارة Ford Thunderbird في مجموعة بيانات التدريب من الأمام، فعندما يُعطى النموذج المدرب صورة لقطة Ford Thunderbird من الجانب، فقد يصنفها بشكل خاطئ، حتى لو تم تدريبها على ملايين الصور الخاصة بالسيارات.
وجد الباحثون أنه إذا كانت مجموعة البيانات أكثر تنوعًا- إذا أظهر المزيد من الصور كائنات من وجهات نظر مختلفة- فإن الشبكة تكون أكثر قدرة على التعميم على الصور أو وجهات النظر الجديدة. يقول بويكس إن تنوع البيانات هو مفتاح التغلب على التحيز.
يقول: "لكن الأمر لا يعني أن المزيد من تنوع البيانات هو الأفضل دائمًا؛ فهناك توتر هنا. عندما تتحسن الشبكة العصبية في التعرف على الأشياء الجديدة التي لم تراها، سيصبح من الصعب عليها التعرف على الأشياء التي شاهدتها بالفعل".
اختبار طرق التدريب Testing training methods
كما درس الباحثون طرق تدريب الشبكة العصبية.
في التعلم الآلي، من الشائع تدريب شبكة لأداء مهام متعددة في نفس الوقت. الفكرة هي أنه في حالة وجود علاقة بين المهام، ستتعلم الشبكة أداء كل مهمة بشكل أفضل إذا تعلمتها معًا.
لكن الباحثين وجدوا أن العكس هو الصحيح- فالنموذج الذي تم تدريبه بشكل منفصل لكل مهمة كان قادرًا على التغلب على التحيز بشكل أفضل بكثير من النموذج الذي تم تدريبه لكلا المهمتين معًا.
يقول: "كانت النتائج مذهلة حقًا. في الواقع، في المرة الأولى التي أجرينا فيها هذه التجربة، اعتقدنا أنها خطأ. استغرق الأمر منا عدة أسابيع لندرك أنها كانت نتيجة حقيقية لأنها كانت غير متوقعة".
لقد تعمقوا في عمق الشبكات العصبية لفهم سبب حدوث ذلك.
وجدوا أن تخصص الخلايا العصبية يبدو أنه يلعب دورًا رئيسيًا. عندما يتم تدريب الشبكة العصبية على التعرف على الأشياء في الصور، يظهر أن نوعين من الخلايا العصبية يظهران- أحدهما متخصص في التعرف على فئة الكائن والآخر متخصص في التعرف على وجهة النظر.
يوضح Boix أنه عندما يتم تدريب الشبكة على أداء المهام بشكل منفصل، تكون تلك الخلايا العصبية المتخصصة أكثر بروزًا. ولكن إذا تم تدريب الشبكة على القيام بكلتا المهمتين في وقت واحد، فإن بعض الخلايا العصبية تصبح مخففة ولا تتخصص في مهمة واحدة. ويقول إن هذه الخلايا العصبية غير المتخصصة أكثر عرضة للارتباك.
يقول: "لكن السؤال التالي الآن، كيف وصلت هذه الخلايا العصبية إلى هناك؟ أنت تدرب الشبكة العصبية وتخرج من عملية التعلم. لم يخبر أحد الشبكة بتضمين هذه الأنواع من الخلايا العصبية في بنيتها. هذا هو الشيء الرائع".
هذا هو أحد المجالات التي يأمل الباحثون استكشافها مع العمل في المستقبل. يريدون معرفة ما إذا كان بإمكانهم إجبار شبكة عصبية على تطوير خلايا عصبية بهذا التخصص. يريدون أيضًا تطبيق نهجهم على المهام الأكثر تعقيدًا ، مثل الكائنات ذات الأنسجة المعقدة أو الإضاءة المتنوعة.
يرجح Boix أن الشبكة العصبية يمكن أن تتعلم التغلب على التحيز، وهو يأمل أن يلهم عملهم الآخرين ليكونوا أكثر تفكيرًا بشأن مجموعات البيانات التي يستخدمونها في تطبيقات الذكاء الاصطناعي.