الأخبار

باحثو معهد ماساتشوستس للتكنولوجيا MIT يستخدمون المحاكاة لتدريب روبوت على الجري بسرعات عالية

الروبوتات ذات الأربع أرجل Four-legged robots ليست شيئًا جديدًا- حيث تقوم Boston Dynamics 'Spot بعمل جولات لبعض الوقت، كما هو الحال مع عدد لا يحصى من التصميمات البديلة مفتوحة المصدر. لكن مع هؤلاء، يزعم الباحثون في معهد ماساتشوستس للتكنولوجيا MIT أنهم حطموا الرقم القياسي لأسرع تشغيل روبوت تم تسجيله. من خلال العمل من مختبر علوم الكمبيوتر والذكاء الاصطناعي (CSAIL) Computer Science and Artificial Intelligence Laboratory التابع لمعهد ماساتشوستس للتكنولوجيا، يقول الفريق إنهم طوروا نظامًا يسمح لـ Mini Cheetah المصمم من قبل معهد ماساتشوستس للتكنولوجيا بتعلم كيفية التشغيل عن طريق التجربة والخطأ في المحاكاة.

في حين أن Mini Cheetah السريع له تطبيقات مباشرة محدودة في المؤسسة، يعتقد الباحثون أنه يمكن استخدام أسلوبهم لتحسين قدرات أنظمة الروبوتات الأخرى- بما في ذلك تلك المستخدمة في المصانع لتجميع المنتجات قبل شحنها إلى العملاء. إنه عمل في الوقت المناسب حيث يسرع الوباء من تبني الروبوتات المستقلة في الصناعة. وفقًا لمسح عالم الأتمتة، فإن 44.9% من مرافق التجميع والتصنيع التي تستخدم الروبوتات حاليًا تعتبر الروبوتات جزءًا لا يتجزأ من عملياتها.
 
التدريب على المحاكاة Training in simulation
يتم "تعليم" الروبوتات المتطورة اليوم لأداء المهام من خلال التعلم المعزز reinforcement learning، وهو نوع من تقنيات التعلم الآلي machine learning technique التي تمكن الروبوتات من التعلم عن طريق التجربة والخطأ باستخدام الملاحظات من أفعالهم وتجاربهم. عندما يقوم الروبوت بإجراء "صحيح right"- أي إجراء سيقوده نحو الهدف المنشود، مثل تخزين شيء ما على الرف- فإنه يتلقى "مكافأة reward". عندما يرتكب خطأ ما، لا يتلقى الروبوت مكافأة أو "يُعاقب punished" بخسارة مكافأة سابقة. بمرور الوقت، يكتشف الروبوت طرقًا لزيادة مكافأته إلى الحد الأقصى وتنفيذ الإجراءات التي تحقق الهدف المنشود.

يمكن تدريب الروبوتات من خلال التعلم المعزز في العالم الحقيقي، لكن التدريب في العالم الحقيقي يستغرق وقتًا طويلاً ويضع ضغطًا على أجهزة الروبوتات، وهو أمر حساس. لهذا السبب يعتمد الباحثون على بيئات محاكاة تشبه ألعاب الفيديو مصممة لتقليد العالم الحقيقي، مما يسمح لهم بإجراء آلاف إلى ملايين التجارب التي تتعلم خلالها عمليات الاستعادة الرقمية لروبوتات العالم الحقيقي مجموعة من الإجراءات. لنأخذ مثالاً واحدًا، تقول شركة Waymo المدعومة من شركة Alphabet، والتي تعمل على تطوير مركبات ذاتية القيادة، إنها قطعت مليارات الأميال في المحاكاة باستخدام الصور الرمزية الرقمية لسياراتها.

في الآونة الأخيرة، دفع الباحثون حدود المحاكاة، في محاولة لأداء معظم- إن لم يكن كل- تدريب الروبوتات في البيئات الرقمية. في العام الماضي، قام باحثون في جامعة كاليفورنيا، بيركلي بتدريب روبوت ذو قدمين يُدعى كاسي على السير في المحاكاة ثم ترجمة تلك المهارات إلى روبوت متماثل في العالم الحقيقي. أيضًا، في العام الماضي، قام علماء بيانات Meta (المعروفة سابقًا باسم Facebook) بتدريب روبوت رباعي الأرجل في محاكاة على أسطح مختلفة حتى يتمكن روبوت متطابق في العالم الحقيقي من التعافي عندما يتعثر.

قام باحثو معهد ماساتشوستس للتكنولوجيا أيضًا بتدريب نظامهم بالكامل على المحاكاة. حصل التوأم الرقمي من Mini Cheetah على 100 يوم من الخبرة المتراكمة على تضاريس رقمية "متنوعة" في ثلاث ساعات فقط من الوقت الفعلي- التعلم من الأخطاء حتى الوصول إلى الإجراءات الصحيحة. عندما نشر الباحثون نظامهم على Mini Cheetah في العالم الحقيقي، زعموا أنه كان قادرًا على تحديد وتنفيذ جميع المهارات ذات الصلة التي تعلموها في الوقت الفعلي.

Gabriel Margolis طالب MIT CSAIL Ph.D وGe Yang زميل ما بعد الدكتوراة  أخبرا MIT News في مقابلة: "يتطلب تحقيق التشغيل السريع دفع الأجهزة إلى أقصى حدودها، على سبيل المثال من خلال التشغيل بالقرب من أقصى خرج لعزم الدوران للمحركات. في مثل هذه الظروف، يصعب نمذجة ديناميكيات الروبوت بشكل تحليلي"، "يركض البشر بسرعة على العشب ويبطئون على الجليد- نحن نتأقلم. يتطلب منح الروبوتات قدرة مماثلة للتكيف تحديدًا سريعًا لتغيرات التضاريس والتكيف بسرعة لمنع الروبوت من السقوط".
 
تطبيقات أخرى Other applications
حقق الباحثون إنجازات رائعة مع الروبوتات في عائلة Cheetah التابعة لمعهد ماساتشوستس للتكنولوجيا من قبل، بما في ذلك الركض بسرعات تصل إلى 14 ميلًا في الساعة، والقفزات الخلفية، والقفز فوق الأشياء. بشكل مثير للإعجاب، يمكن أن يتوازن Cheetah 3 على ثلاث أرجل، باستخدام الرابعة كذراع مؤقت.

لكن الباحثين يقولون إن نهجهم يلغي الحاجة إلى برمجة كيفية عمل الروبوت- Mini Cheetah أو غير ذلك- في كل موقف ممكن. هذا يتعارض مع النموذج التقليدي في الروبوتات، حيث يخبر البشر الروبوت بالمهمة التي يجب إنجازها وكيفية القيام بها.