الأخبار

ما الذى حطم Facebook : للتبسيط BGP و DNS وفكرة الحاوية الموحدة

ربما كانت هذه الساعات الست هي الأطول بالنسبة لمهندسي Facebook ويجب أن يشعروا بوقت أطول بكثير للمستخدمين بما في ذلك الشركات الصغيرة والمتوسطة التي تعتمد بشكل كبير على Facebook و WhatsApp و Messenger و Instagram. إن انقطاع التكنولوجيا ليس أمرًا غير شائع، ولكن مرة أخرى، لا يوجد أكثر من 3.5 مليار مستخدم حول العالم في العديد من المنصات. أكثر تطبيقات المراسلة شيوعًا في العالم، WhatsApp، جنبًا إلى جنب مع Instagram و Messenger، وكذلك Facebook Workplace، توقف عن العمل في وقت متأخر من ليلة الاثنين ولا يمكن إصلاح الانقطاع إلا في وقت مبكر من 5 أكتوبر. كان سبب توقف خدماتها عن الاتصال بالإنترنت.

تراجعت جميع خدمات Facebook معًا نظرًا لأنها تشترك في نفس البنية التحتية بما يتماشى مع محاولة الشركة لدمج جميع التقنيات الموجودة خلف الكتل المختلفة، كواحد. نظرة عامة واحدة لجميع المستخدمين عبر جميع التطبيقات تجعلهم أكثر قوة في عالم الإعلانات المستهدفة عبر الإنترنت. ومع ذلك، فإنه يجعل الهيكل عرضة لفشل هائل كما أظهر الانقطاع الهائل. نحن الآن قادرون أخيرًا على تجميع تسلسل الأحداث التي أدت إلى انقطاع الخدمة والتدابير التصحيحية النهائية المتخذة، مع تبسيط المصطلحات التقنية المعقدة.

كسر BGP: هذه الخريطة لم تكن موجودة منذ فترة
كانت الساعة حوالي الساعة 11:39 صباحًا بالتوقيت الشرقي في 4 أكتوبر، عندما أجرى شخص ما في Facebook تحديثًا لسجلات بروتوكول بوابة الحدود (BGP) للخدمة. BGP هي في الأساس خريطة للخدمات المتوفرة على شبكة الإنترنت العالمية وتسمح للشبكات باختيار أفضل توجيه أو مسار لها. يمتلك Facebook BGP الخاص به، كما هو الحال مع أي مزود خدمة إنترنت آخر. إنها الخريطة التي يستخدمها هاتفك أو جهاز الكمبيوتر أو متصفح الويب للعثور على Facebook.com عندما تضغط على عنوانه في متصفح الويب.

يتم تكوين BGPs على أجهزة التوجيه التي تسمح لخوادم Facebook بالاتصال بالإنترنت والتحدث مع بعضها البعض. التحديث كسر BGP هذا. هذا يعني ببساطة أن تطبيق Facebook على هاتفك أو متصفح الويب الخاص بك عندما دخلت facebook.com، لم يكن لديه أي فكرة عن مكان العثور على ما كنت تبحث عنه. لذلك، تظهر رسائل الخطأ مثل "لا يمكن الوصول إلى هذا الموقع".

لا تزال أسباب تحليل BGP، أو ببساطة، خريطة لتطبيقات وخدمات Facebook، لا تزال تخمين أي شخص. تصر الشركة في التوضيح على أنه كان "تغيير التكوين" الذي تسبب في بدء المشكلة. يشير ذلك إلى خطأ بشري أثناء تكوين التحديث أو تطبيقه، أو خللًا في البرنامج لم يتلق تحديثًا جديدًا على النحو المنشود. ونظرًا لأن كل عمل في Facebook موحد، مما يضع Facebook و Instagram و WhatsApp و Messenger وحتى Facebook Workplace في دلو واحد كبير، فإن كسر المقبض الفردي جعل كل شيء بداخله غير قابل للاستخدام.

نطاق Facebook حيث تم طرحه للبيع
أول الأشياء أولاً، موقع Facebook.com لم يكن معروضًا للبيع رسميًا. ومع ذلك، بمجرد كسر BGP لإزالة خدمات Facebook من الويب، أصبحت سجلات نظام اسم المجال Domain Name System (DNS) الخاصة بها غير قابلة للوصول. فكر في DNS على أنه دليل الهاتف للإنترنت، بينما BGP هي الخريطة التي تنقلك إلى جهة الاتصال الصحيحة. أثناء ظهور خطأ BGP، تسببت مشكلات التكوين أيضًا في اختفاء DNS الخاص بـ Facebook ومجموعة التطبيقات. تم كسر المسار والوجهة. وهذا يعني أن المواقع التي تبيع أسماء النطاقات، وتبحث تلقائيًا عن أسماء النطاقات غير النشطة، بدأت في إدراج facebook.com على أنه معروض للبيع. تم إجراء تصحيحات يدوية لإزالة تلك القوائم، على الرغم من أن الكثير من مستخدمي Twitter استمتعوا بعروض النطاق.

مركزية لدرجة أنه حتى الوصول المادي كان مقيدًا
لتصحيح الفوضى التي حدثت، هرع مهندسو Facebook إلى مركز بيانات كاليفورنيا. نظرًا لعدم توفر الخوادم عبر الإنترنت، بما في ذلك للموظفين داخل الشبكات الخاصة بالشركة، لم يتمكنوا من إصدار تصحيح آخر عن بُعد لإصلاح خطأ التهيئة. ثم واجهوا صعوبة في دخول المبنى. وذلك لأن أنظمة المصادقة، حيث يتم فحص الشارات للوصول إلى أجزاء مختلفة من المباني المادية، كانت أيضًا معطلة مع Facebook Workplace للمستخدمين. في النهاية تمكنوا من الوصول إلى الخوادم. قال Mike Schroepfer، كبير مسؤولي التكنولوجيا في Facebook، في رسالة بريد إلكتروني للموظفين بعد استعادة الخدمات، إن المشكلة "تؤثر على العمود الفقري لشبكاتنا الذي يربط جميع مراكز البيانات لدينا معًا".

لقد استغرقت الخدمات ما يقرب من 6 ساعات لإثبات وجودها على الإنترنت مرة أخرى. بالنسبة لأنظمة ضخمة كهذه، تستغرق إعادة التشغيل بعد التحديث وقتًا. وحتى في هذه الحالة، هناك فرص في أن يكون الوصول غير متسق لفترة من الوقت حيث يتم إعادة بناء قواعد بيانات الخادم. "تعلمت فرقنا الهندسية أن تغييرات التكوين على أجهزة التوجيه الأساسية التي تنسق حركة مرور الشبكة بين مراكز البيانات لدينا تسببت في حدوث مشكلات أدت إلى قطع هذا الاتصال. كان لهذا الاضطراب في حركة مرور الشبكة تأثير متتالي على طريقة تواصل مراكز البيانات لدينا، مما أدى إلى توقف خدماتنا "، كما يوضح Santosh Janardahan، نائب رئيس البنية التحتية في Facebook. وتابع قائلاً: "نريد أن نوضح في هذا الوقت أننا نعتقد أن السبب الجذري لهذا الانقطاع كان تغييرًا خاطئًا في التكوين. كما أنه ليس لدينا أي دليل على أن بيانات المستخدم قد تعرضت للاختراق نتيجة لوقت التعطل هذا ".

من المتوقع أن يكون التأثير على الأعمال ضخمًا
ليس لدى Facebook أي أرقام أو بيانات رسمية حول عدد الشركات التي تأثرت عبر Facebook و WhatsApp و Instagram، أو حجم الخسائر للشركات الصغيرة والمتوسطة في نافذة الانقطاع هذه. أو أنها لا تقولها بصوت عالٍ حتى الآن. تشير شركة NetBlocks لمراقبة الأمن السيبراني في المملكة المتحدة إلى أن الاقتصاد العالمي خسر ما يصل إلى 160 مليون دولار في غضون الساعة الأولى من الانقطاع. تقدر أداة تكلفة إيقاف التشغيل Cost Of Shutdown Tool (COST) الخاصة بهم انقطاع الإنترنت باستخدام مؤشرات محددة بما في ذلك من البنك الدولي والاتحاد الدولي للاتصالات International Telecommunication Union (ITU). نظرًا لأن انقطاع الخدمة عالميًا، وعبر مجموعة تطبيقاتها، كان من الممكن أن تشعر بالتأثير أكثر من 200 مليون شركة تستخدم أدوات Facebook في جميع أنحاء العالم. هذه أرقام وفقًا لأحدث بيانات إحصاءات الشركة. غالبية هذه الشركات، إن لم يكن كلها، ستتأثر سلبًا في ساعات الانقطاع. يقولون أن هناك أكثر من 10 ملايين معلن نشط عبر الأنظمة الأساسية.

هذا ليس انقطاع Facebook الأول
لا يزال الانقطاع الهائل الذي عانى منه Facebook في وقت سابق اليوم لا مثيل له من حيث الحجم. ومع ذلك، فهي ليست الأولى لعملاق التكنولوجيا هذا العام. في يونيو، عانى موقع Facebook والخدمات من انقطاع الخدمة، لكنه لم يدم طويلاً. عانت الشركة من انقطاعات متفرقة عبر Facebook و WhatsApp و Instagram في مايو وأبريل ومارس وفبراير من هذا العام، على الرغم من أن نطاقها التخريبي كان محدودًا بالمقارنة.