شركات Apple و Meta و Google تعتبر من الأمور الأكثر شهرة على درب OpenAI

نحن في الشهر الثامن من سباق التسلح التوليدي للذكاء الاصطناعي، وهو موجة من الأنشطة التي انطلقت من خلال إصدار ChatGPT من OpenAI في أواخر عام 2022. بينما كان لاعبو التكنولوجيا الكبار الآخرون مثل Meta و Google لسنوات يعملون على نماذج اللغات الكبيرة التي تشغل روبوتات الدردشة الجديدة للذكاء الاصطناعي، كان OpenAI أول من أدرك أن روبوتات الدردشة يمكنها تحقيق مهارات اتصال هائلة تقريبًا من بيانات التدريب (على الإنترنت). أظهر OpenAI هذه النتائج ليس من خلال نشر الأوراق البحثية، ولكن عن طريق السماح للأشخاص برؤية أنفسهم بأنفسهم باستخدام ChatGPT، وكان التأثير مدويًا. تم اعتبار نماذج OpenAI على أنها أحدث ما توصلت إليه التقنية، وهي محقة في ذلك.

ولكن بعد ثمانية أشهر في دائرة الضوء، لا يبدو أن شركة أوبن إيه آي لا يمكن تعويضها كما كانت قبل ثلاثة أشهر فقط. لاحظ عدد متزايد من المطورين الذين يعتمدون على نماذج OpenAI في الأسابيع الأخيرة انخفاضًا في سرعة ودقة مخرجات النماذج (أنكرت OpenAI أن الأداء يتدهور). يكاد يكون من المؤكد أن هذا مرتبط بنقص قوة الحوسبة المتاحة لتشغيل نماذج الشركة. لم تعد شركة OpenAI، التي تعمل نماذجها على خوادم Microsoft Azure، تتمتع بإمكانية الوصول إلى قوة الحوسبة التي أعطتها ريادتها الأولية في سباق LLM.

يقول مصدر ذو موقع جيد أن المسؤولين التنفيذيين في Microsoft (بما في ذلك Satya Nadella) يجتمعون الآن أسبوعيًا مع OpenAI لإدارة موارد الخادم المخصصة لتشغيل OpenAI LLMs. من المحتمل أن تطلب OpenAI من Microsoft المزيد من قوة GPU، بينما تطلب Microsoft بلا شك من OpenAI إيجاد طرق للاقتصاد. تشعر Microsoft بالقلق الشديد بشأن النقص في الحوسبة لدرجة أنها بدأت في توقيع صفقات مع شركات سحابية ناشئة أصغر للوصول إلى المزيد من الخوادم المناسبة للذكاء الاصطناعي. وفي الوقت نفسه، تمتلك Meta و Google و Apple نفس القدر من المال، بالإضافة إلى تصميمات الرقائق الخاصة بهم، لعمل الذكاء الاصطناعي.

وهذه ليست المشكلة الوحيدة التي تثار الآن ضد OpenAI. أطلقت Meta للتو برنامج LLM جديد مفتوح المصدر (مجاني ومتاح) يسمى Llama 2 والذي قد ينافس نموذج OpenAI GPT-4. يقال أيضًا أن شركة آبل تعمل الآن على تطوير منافستها ChatGPT على أمل اللحاق بـ OpenAI. والأهم من ذلك، اكتشف كل من Google و Meta كيفية السماح لـ LLM بالتفاعل مع الصور والكلمات وإخراجها؛ قالت شركة OpenAI إن أحدث طراز لها، GPT-4، سيكون متعدد الوسائط، لكن عملتها حتى الآن هي كلمات ورموز كمبيوتر.

وفوق كل شيء، أصبحت لجنة التجارة الفيدرالية (FTC) شديدة الفضول بشأن ممارسات تطوير نموذج OpenAI ونموذج الأعمال فيها. أرسلت الوكالة، برئاسة لينا خان، رسالة إلى OpenAI الأسبوع الماضي تحتوي على 20 صفحة من الأسئلة.

شركة Apple بدأت بهدوء لعبة GPT الخاصة بها
كما توقعنا في شهر مارس، تم سحب شركة Apple إلى سباق التسلح AI، جنبًا إلى جنب مع جميع شركات FAANG الأخرى.

ذكر مارك جورمان من بلومبيرج يوم الأربعاء أن شركة آبل تعمل بهدوء على تطوير نماذج ذكاء اصطناعي خاصة بها، وقد تحاول التنافس مع أوبن إيه آي وجوجل في حروب روبوتات الدردشة. تقول مصادر Gurman (غير المسماة) إن إدارة Apple لا تزال تقرر كيفية قيام الشركة بنشر التكنولوجيا علنًا، والتي تميل إلى ابتكار الحقائق، وفي بعض الأحيان، تتعدى على الخصوصية.

يقال إن شركة Apple قد طورت إطار عمل جديدًا، يُشار إليه داخليًا باسم "Ajax"، لتطوير LLMs. أفاد Gurman أن مشروع LLM chatbot (المشار إليه من قبل البعض في الشركة باسم "Apple GPT") أصبح "جهدًا كبيرًا" داخل Apple، ينطوي بالفعل على تعاون بين عدة فرق.

انتعش سهم Apple بنسبة 2.3٪ (وهو مكسب سريع قدره 60 مليار دولار من القيمة السوقية) بعد ظهور قصة بلومبرج، وهو بمثابة تذكير لجميع شركات التكنولوجيا الكبرى بأنها ملتزمة بمعتقدات وأهواء المستثمرين - ومجتمع الاستثمار جميعًا في مجال الذكاء الاصطناعي التوليدي.

سبب أهمية إضافة Google للصور إلى Bard
وقد شبّه البعض تطور النماذج اللغوية الكبيرة بنمو الأطفال الرضع. يتعلم الأطفال الكثير عن العالم بمفردهم (من خلال حواسهم) ومن خلال والديهم. الاختلاف الرئيسي، بالطبع، هو أنه في حين أن الأطفال لديهم جميع الحواس الخمس لاستيعاب المعلومات، فإن LLM لديهم فقط كلمات مأخوذة من الإنترنت يمكن من خلالها التعرف على العالم، بالإضافة إلى بعض ردود الفعل البشرية على مخرجاتهم.

هذا هو السبب في أهمية إعلان Google الأسبوع الماضي عن منحها دعم Bard LLM للصور. من المؤكد أن Bard ليست أكثر برامج LLM أداءً - فهي في الواقع فقيرة من عدة نواحٍ مقارنة بأقرانها - ولكنها أصبحت أول روبوت محادثة LLM متاح للجمهور يتمتع بهدية البصر، إذا صح التعبير. يمكن للمستخدمين الآن إدخال صورة كموجه، ويمكن لـ Bard تحليل الصورة وتقديم مزيد من المعلومات عنها. تخيل أنك تلتقط صورة لغدائك وتطلب من Bard تحديد المكونات والسعرات الحرارية (نصيحة القبعة:BenBajarin). أو تحويل ملاحظات الاجتماع المكتوبة بخط اليد إلى نص منظم. نعم، إنه يرتكب أخطاء، وأخطاء صارخة، ولكن المزيد من التحسينات التدريبية قد تصححها.

اليوم هي مجرد صور، ولكن غدًا، قد يكون Bard قادرًا على معالجة الفيديو بالحركة الكاملة في الوقت الفعلي. قد يكون قادرًا على التعلم باستمرار من مجموعة من أجهزة استشعار الصور الموضوعة داخل محمية طبيعية، على سبيل المثال. أو قد يتعلم من خلال استيعاب مجموعة مقاطع فيديو YouTube التي تمتلكها Google بالكامل. إذا كنت من خارج كوكب الأرض سقطت على الأرض، فستجد طرقًا قليلة لتعلم بيئتك الجديدة بشكل أسرع.

تضع Meta أيضًا عضلاتها البحثية وراء الذكاء الاصطناعي متعدد الوسائط. أعلنت الشركة الأسبوع الماضي عن نموذج جديد لتحويل النص إلى صورة يسمى CM3leon يقوم بإنشاء صور من المطالبات النصية بجودة عالية، بالإضافة إلى كتابة التعليقات للصور الموجودة. إذن ماذا عن OpenAI؟ ربما تكون الشركة قد ترددت في السماح لنموذج GPT-4 الخاص بها بمعالجة الصور، وفقًا لتقارير New York Times، لأنها تخشى أن يتعرف النموذج على وجوه أشخاص حقيقيين ويقول أشياء عنهم.