الأخبار

تحليلات الفيديو مع التعلم العميق تستكشف آفاق جديدة

Video Analytics with Deep Learning is Exploring New Horizons 

نحن نواجه واقعًا يوميًا بحيث أننا محاطون بالعديد من أجهزة التقاط الفيديو الذكية. تلتقط هذه الأجهزة معلومات حول كيف نعيش وماذا نفعل على سبيل المثال، بسبب كاميرات المراقبة وكاميرات الحركة، وكذلك الهواتف الذكية وحتى كاميرات الفيديو القديمة الجيدة، يمكننا تسجيل مقاطع الفيديو على نطاق وسرعة غير مألوفين. هناك بالفعل بيانات ومعلومات غنية مزروعة في كل واحد من تلك التسجيلات.

قدمت التحسينات الأخيرة في تحليلات الفيديو ميزة مميزة، تتراوح من التطبيقات التي تحسب الأفراد في المناسبات، إلى التعرف التلقائي على لوحة الترخيص، إلى جانب التعرف على الوجه أو وقوف السيارات الذكي.

تذهب جميع الاعتمادات إلى التقدم الهائل الذي تم إحرازه في التعلم العميق، وقد قدمت تحليلات الفيديو أتمتة المهام automation of tasks التي كانت في وقت من الأوقات المجال الانتقائي للأشخاص. اليوم، تم تطوير برمجة تحليل محتوى الفيديو لمعالجة الفيديو والتعرف على العناصر التي تظهر وتمييزها وتمييزها وتقديم معلومات فيديو يمكن الوصول إليها وقابلة للتصفية والتي يمكن أن تقود قدرات تحليلية واسعة.

لقد أدى التعلم الآلي Machine learning، وعلى وجه التحديد، التحسين الرائع لحلول التعلم العميق deep learning، إلى تغيير تحليلات الفيديو.

جعل استخدام الشبكات العصبية العميقة (Deep Neural Networks DNNs) من الممكن تصور إعداد أنظمة تحليل الفيديو التي تنتحل شخصية السلوك البشري، مما يؤدي إلى تغيير في النظرة العامة. بدأت بأطر تعتمد على أساليب رؤية الكمبيوتر النموذجية (على سبيل المثال، إطلاق تنبيه إذا أصبحت صورة الكاميرا باهتة بشكل مفرط أو تغيرت جذريًا) وانتقلت إلى أنظمة مجهزة لتمييز العناصر الصريحة في الصورة وتتبع مسارها.

على سبيل المثال، تم استخدام التعرف الضوئي على الأحرف (Optical Character Recognition OCR) لفترة طويلة لإزالة النص من الصور. على المستوى الأساسي، يمكن أن تقوم بالحيلة لتطبيق خوارزميات OCR مباشرة على صورة لوحة ترخيص لإدراك رقمها. في النظرة السابقة للعالم، قد يعمل هذا إذا كانت الكاميرا موضوعة بحيث، في وقت تنفيذ OCR، كنا على يقين من أننا كنا نسجل لوحة ترخيص.

التعلم العميق هو في الأساس اتفاقية تدريب يتم من خلالها تقديم آلة إلى أحجام من البيانات المصنفة "للتعلم" لإدراك وتمييز البيانات المماثلة في مجموعات البيانات الجديدة. نسخ الطريقة التي يتم بها تعليم الإنسان، التعلم العميق يمكّن التقنيات من التمييز والتعرف على الأشياء بشكل أكثر كفاءة بناءً على زيادة التعرض للمعلومات. مدفوعًا ببنية تحتية قوية للأجهزة، يتيح التعلم العميق إخراجًا تحليليًا أسرع، وزيادة اكتشاف الكائنات، وتحسين أداء المعالجة، ودقة التعرف.

بسبب الانتصارات الجديرة بالملاحظة لتطبيقات التعلم العميق، نحن مستعدون حاليًا لدعم أداء تحليل الفيديو بشكل كبير وبدء دراسات جديدة لتحليل محتوى الفيديو. على سبيل المثال، أظهرت الشبكات العصبية التلافيفية convolutional neural networks انتشارًا في إظهار مفاهيم بصرية ذات مستوى هام، بينما أثبتت الشبكات العصبية المتقطعة أنها واعدة في نمذجة العناصر الدنيوية في التسجيلات. تحليلات الفيديو العميقة، أو تحليلات الفيديو مع التعلم العميق، تتحول إلى منطقة بحث ناشئة في مجال التعرف على الأنماط.

تقدير الوضع هو استراتيجية أخرى للتعلم العميق تستخدم كوسيلة لتصنيف الإجراءات. تصنيف العمل هو المجموعة الثانية من المهام المرتبطة ببناء أطر عمل للمراقبة قائمة على الرؤية الحاسوبية. عندما نعرف عدد الأفراد الموجودين لدينا في المتجر، وبمجرد أن نفهم ما كانوا يفعلونه ، يمكننا أن نتحقق من أفعالهم.

تُستخدم تحليلات الفيديو لرعاية مشكلات العالم الحقيقي في مدينة نيويورك. لفهم الأحداث المرورية الهامة على الأرجح، استخدمت إدارة النقل بمدينة نيويورك تحليلات الفيديو والتعلم الآلي لتحديد انتهاكات وقوف السيارات والاختناقات المرورية وأنماط الطقس وهذه هي البداية فقط. تلتقط الكاميرات الأحداث وتعالجها وترسل تنبيهات في الوقت الفعلي إلى سلطات المدينة.

يتحول التعلم العميق إلى جزء أساسي من التطوير التحليلي، ونجد باستمرار تطبيقاته الرائدة مع تقدم البحث في هذا المجال. اليوم، يساعدنا في الاهتمام بالقضايا بشكل أسرع وأكثر دقة من أي وقت مضى، وحتى معالجة الصعوبات الجديدة التي لم نتوقع أبدًا التغلب عليها.