أعلنت شركة Facebook يوم الخميس عن مشروع بحثي جمعت فيه 2200 ساعة من لقطات الشخص الأول من جميع أنحاء العالم لتدريب الجيل القادم من نماذج الذكاء الاصطناعي.
يُطلق على المشروع اسم Ego4D، وقد يثبت أنه مهم لقسم Reality Labs في Facebook، والذي يعمل على العديد من المشاريع التي يمكن أن تستفيد من نماذج الذكاء الاصطناعي المدربة باستخدام لقطات فيديو تم تصويرها من منظور الإنسان. يشمل ذلك النظارات الذكية، مثل Ray-Ban Stories التي أصدرتها Facebook الشهر الماضي، والواقع الافتراضي، الذي استثمر فيه Facebook بكثافة منذ استحواذها على Oculus عام 2014 بقيمة 2 مليار دولار.
يمكن أن تعلم اللقطات الذكاء الاصطناعي أن يفهم أو يتعرف على شيء ما في العالم الحقيقي، أو عالم افتراضي، قد تراه من منظور الشخص الأول من خلال زوج من النظارات أو سماعة رأس Oculus.
قال Facebook إنه سيتيح مجموعة بيانات Ego4D للجمهور للباحثين في نوفمبر.
قالت Kristen Grauman، كبيرة علماء الأبحاث في Facebook، لشبكة CNBC: "هذا الإصدار، الذي يمثل مجموعة بيانات مفتوحة وتحديًا بحثيًا، سيحفز التقدم بالنسبة لنا داخليًا ولكن أيضًا على نطاق واسع في المجتمع الأكاديمي و[يسمح] للباحثين الآخرين بالوقوف وراء هذه المشكلات الجديدة ولكن يمكنهم الآن القيام بذلك في بطريقة أكثر جدوى وعلى نطاق أوسع".
قالت Grauman: "إن مجموعة البيانات يمكن نشرها في نماذج الذكاء الاصطناعي المستخدمة لتدريب التكنولوجيا مثل الروبوتات لفهم العالم بسرعة أكبر". وقالت Grauman: "تقليديًا، يتعلم الروبوت من خلال القيام بأشياء في العالم أو حمله يدويًا ليُظهر كيفية القيام بالأشياء". "هناك فرص للسماح لهم بالتعلم من الفيديو فقط من تجربتنا الخاصة."
اعتمد Facebook وكونسورتيوم مكون من 13 جامعة شريكة على أكثر من 700 مشارك في تسع دول لالتقاط لقطات من منظور الشخص الأول. يقول Facebook إن Ego4D لديها أكثر من 20 مرة من الساعات من أي مجموعة بيانات أخرى من نوعها.
من بين شركاء Facebook الجامعيين كارنيجي ميلون في الولايات المتحدة، وجامعة بريستول في المملكة المتحدة، وجامعة سنغافورة الوطنية، وجامعة طوكيو في اليابان، والمعهد الدولي لتكنولوجيا المعلومات في الهند، من بين آخرين.
تم التقاط اللقطات في الولايات المتحدة والمملكة المتحدة وإيطاليا والهند واليابان وسنغافورة والمملكة العربية السعودية.
يُطلق على المشروع اسم Ego4D، وقد يثبت أنه مهم لقسم Reality Labs في Facebook، والذي يعمل على العديد من المشاريع التي يمكن أن تستفيد من نماذج الذكاء الاصطناعي المدربة باستخدام لقطات فيديو تم تصويرها من منظور الإنسان. يشمل ذلك النظارات الذكية، مثل Ray-Ban Stories التي أصدرتها Facebook الشهر الماضي، والواقع الافتراضي، الذي استثمر فيه Facebook بكثافة منذ استحواذها على Oculus عام 2014 بقيمة 2 مليار دولار.
يمكن أن تعلم اللقطات الذكاء الاصطناعي أن يفهم أو يتعرف على شيء ما في العالم الحقيقي، أو عالم افتراضي، قد تراه من منظور الشخص الأول من خلال زوج من النظارات أو سماعة رأس Oculus.
قال Facebook إنه سيتيح مجموعة بيانات Ego4D للجمهور للباحثين في نوفمبر.
قالت Kristen Grauman، كبيرة علماء الأبحاث في Facebook، لشبكة CNBC: "هذا الإصدار، الذي يمثل مجموعة بيانات مفتوحة وتحديًا بحثيًا، سيحفز التقدم بالنسبة لنا داخليًا ولكن أيضًا على نطاق واسع في المجتمع الأكاديمي و[يسمح] للباحثين الآخرين بالوقوف وراء هذه المشكلات الجديدة ولكن يمكنهم الآن القيام بذلك في بطريقة أكثر جدوى وعلى نطاق أوسع".
قالت Grauman: "إن مجموعة البيانات يمكن نشرها في نماذج الذكاء الاصطناعي المستخدمة لتدريب التكنولوجيا مثل الروبوتات لفهم العالم بسرعة أكبر". وقالت Grauman: "تقليديًا، يتعلم الروبوت من خلال القيام بأشياء في العالم أو حمله يدويًا ليُظهر كيفية القيام بالأشياء". "هناك فرص للسماح لهم بالتعلم من الفيديو فقط من تجربتنا الخاصة."
اعتمد Facebook وكونسورتيوم مكون من 13 جامعة شريكة على أكثر من 700 مشارك في تسع دول لالتقاط لقطات من منظور الشخص الأول. يقول Facebook إن Ego4D لديها أكثر من 20 مرة من الساعات من أي مجموعة بيانات أخرى من نوعها.
من بين شركاء Facebook الجامعيين كارنيجي ميلون في الولايات المتحدة، وجامعة بريستول في المملكة المتحدة، وجامعة سنغافورة الوطنية، وجامعة طوكيو في اليابان، والمعهد الدولي لتكنولوجيا المعلومات في الهند، من بين آخرين.
تم التقاط اللقطات في الولايات المتحدة والمملكة المتحدة وإيطاليا والهند واليابان وسنغافورة والمملكة العربية السعودية.
قال Facebook إنه يأمل في توسيع المشروع ليشمل المزيد من البلدان، بما في ذلك كولومبيا ورواندا.
قالت Grauman: "إن أحد قرارات التصميم المهمة لهذا المشروع هو أننا أردنا شركاء يكونون في المقام الأول خبراء بارزين في هذا المجال، ومهتمين بهذه المشكلات ومتحمسين لمتابعتها ولكن لديهم أيضًا تنوعًا جغرافيًا".
قالت Grauman: "إن أحد قرارات التصميم المهمة لهذا المشروع هو أننا أردنا شركاء يكونون في المقام الأول خبراء بارزين في هذا المجال، ومهتمين بهذه المشكلات ومتحمسين لمتابعتها ولكن لديهم أيضًا تنوعًا جغرافيًا".
يأتي الإعلان عن Ego4D في وقت مثير للاهتمام على Facebook.
تعمل الشركة بشكل مطرد على تكثيف جهودها في مجال الأجهزة. في الشهر الماضي، أصدرت نظارات Ray-Ban Stories بقيمة 299 دولارًا، وهي أول نظارات ذكية لها. وفي يوليو، أعلن Facebook عن تشكيل فريق منتج للعمل على وجه التحديد على "metaverse"، وهو مفهوم يتضمن إنشاء عوالم رقمية يمكن أن يعيشها العديد من الأشخاص في نفس الوقت.
لكن خلال الشهر الماضي، تعرض Facebook لوابل من القصص الإخبارية النابعة من مجموعة من أبحاث الشركة الداخلية التي سربتها Frances Haugen، مدير منتج سابق على Facebook تحول إلى المبلغين عن المخالفات. من بين الأبحاث التي تم إصدارها، كانت هناك شرائح أظهرت أن Instagram ضار بالصحة العقلية للمراهقين.
تم التقاط اللقطات باستخدام أجهزة جاهزة مثل كاميرات GoPro ونظارات Vuzix الذكية.
من أجل الخصوصية، قال Facebook إن المشاركين تلقوا تعليمات لتجنب التقاط خصائص التعريف الشخصية عند جمع اللقطات في الداخل. يتضمن ذلك وجوه الأشخاص والمحادثات والوشم والمجوهرات. قالت شركة Facebook إنها أزلت معلومات التعريف الشخصية من مقاطع الفيديو وتعتيم وجوه المارة وأرقام لوحات ترخيص المركبات. وقالت الشركة إنه تمت إزالة الصوت أيضًا من العديد من مقاطع الفيديو.
قالت Grauman: "شركاء الجامعة الذين قاموا بجمع مقاطع الفيديو هذه، كانت الخطوة رقم 1 بالنسبة لهم جميعًا عملية مكثفة ومهمة جدًا لإنشاء سياسة للتجميع المناسب".
تعمل الشركة بشكل مطرد على تكثيف جهودها في مجال الأجهزة. في الشهر الماضي، أصدرت نظارات Ray-Ban Stories بقيمة 299 دولارًا، وهي أول نظارات ذكية لها. وفي يوليو، أعلن Facebook عن تشكيل فريق منتج للعمل على وجه التحديد على "metaverse"، وهو مفهوم يتضمن إنشاء عوالم رقمية يمكن أن يعيشها العديد من الأشخاص في نفس الوقت.
لكن خلال الشهر الماضي، تعرض Facebook لوابل من القصص الإخبارية النابعة من مجموعة من أبحاث الشركة الداخلية التي سربتها Frances Haugen، مدير منتج سابق على Facebook تحول إلى المبلغين عن المخالفات. من بين الأبحاث التي تم إصدارها، كانت هناك شرائح أظهرت أن Instagram ضار بالصحة العقلية للمراهقين.
تم التقاط اللقطات باستخدام أجهزة جاهزة مثل كاميرات GoPro ونظارات Vuzix الذكية.
من أجل الخصوصية، قال Facebook إن المشاركين تلقوا تعليمات لتجنب التقاط خصائص التعريف الشخصية عند جمع اللقطات في الداخل. يتضمن ذلك وجوه الأشخاص والمحادثات والوشم والمجوهرات. قالت شركة Facebook إنها أزلت معلومات التعريف الشخصية من مقاطع الفيديو وتعتيم وجوه المارة وأرقام لوحات ترخيص المركبات. وقالت الشركة إنه تمت إزالة الصوت أيضًا من العديد من مقاطع الفيديو.
قالت Grauman: "شركاء الجامعة الذين قاموا بجمع مقاطع الفيديو هذه، كانت الخطوة رقم 1 بالنسبة لهم جميعًا عملية مكثفة ومهمة جدًا لإنشاء سياسة للتجميع المناسب".