كيف يبشر GPT-3 بهدوء بعصر الذكاء الاصطناعي؟ ثورة

شبكة الدماغ على التوضيح الأوردة
كريس ديجرو / الاتجاهات الرقمية، غيتي إيماجز

كانت خوارزمية إنشاء النص GPT-2 الخاصة بشركة OpenAI تعتبر ذات يوم خطيرة للغاية بحيث لا يمكن إصدارها. ثم أُطلق سراحه، واستمر العالم في الدوران.

محتويات

  • ما فائدته؟ كل شيء على الاطلاق
  • المزيد من أين جاء ذلك
  • الثور معقول *** ر
  • العودة إلى الغرفة الصينية
  • تغذية الببغاوات العشوائية
  • نماذج اللغة ومستقبل الذكاء الاصطناعي

في وقت لاحق، يبدو نموذج اللغة GPT-2 الصغير نسبيًا (1.5 مليار معلمة تافهة) تافهًا بجوار تكملة له، GPT-3، التي تضم 175 مليار معلمة ضخمة، تم تدريبها على 45 تيرابايت من البيانات النصية، وتكلفتها 12 مليون دولار (على الأقل) يبني.

"كان منظورنا، وموقفنا في ذلك الوقت، هو الحصول على إصدار مرحلي، والذي كان مثل، في البداية، تقوم بإصدار نموذج أصغر وتنتظر لترى ما سيحدث،" ساندهيني أغاروال، خبير الذكاء الاصطناعي. قال باحث السياسات في OpenAI لـ Digital اتجاهات. "إذا كانت الأمور تبدو جيدة، فإنك تطلق الحجم التالي للنموذج. السبب الذي دفعنا إلى اتباع هذا النهج هو أن هذه، بصراحة، [ليست مجرد مياه مجهولة بالنسبة لنا، ولكنها أيضًا] مياه مجهولة للعالم بأسره.

متعلق ب

  • الصيغة المضحكة: لماذا تعتبر الفكاهة الناتجة عن الآلة هي الكأس المقدسة للذكاء الاصطناعي
  • مستقبل الذكاء الاصطناعي: 4 أشياء كبيرة يجب مراقبتها في السنوات القليلة المقبلة
  • استشعار العاطفة موجود هنا، ويمكن أن يكون في مقابلة العمل القادمة

انتقل إلى يومنا هذا، بعد تسعة أشهر تم إصدار GPT-3 في الصيف الماضي، وهي تعمل بالطاقة ما يصل إلى 300 طلب بينما تولد 4.5 مليار كلمة هائلة يوميًا. نظرًا لأنه تم إنشاءه باستخدام الجمل القليلة الأولى فقط من المستند، فإنه قادر على إنشاء المزيد من النصوص التي لا نهاية لها على ما يبدو بنفس النمط - حتى بما في ذلك الاقتباسات الوهمية.

هل سيدمر العالم؟ استنادا إلى التاريخ الماضي، يكاد يكون من المؤكد لا. لكنها تعمل على إنشاء بعض تطبيقات الذكاء الاصطناعي التي ستغير قواعد اللعبة. ممكن، كل ذلك مع طرح بعض الأسئلة العميقة جدًا على طول الطريق.

ما فائدته؟ كل شيء على الاطلاق

في الآونة الأخيرة، دعا فرانسيس جيرفيس، مؤسس شركة ناشئة معزز، استخدم GPT-3 لمساعدة الأشخاص الذين يعانون من إيجارهم على كتابة خطابات للتفاوض بشأن تخفيضات الإيجار. "أصف حالة الاستخدام هنا بأنها" نقل النمط "، قال جيرفيس لـ Digital Trends. "[يأخذ] نقاطًا نقطية، والتي ليس من الضروري حتى أن تكون باللغة الإنجليزية المثالية، و[يخرج] جملتين أو ثلاث جمل باللغة الرسمية."

مقاطع الفيديو الموصى بها

بدعم من هذا النموذج اللغوي القوي للغاية، تسمح أداة Jervis للمستأجرين بوصف وضعهم وسبب حاجتهم إلى تسوية مخفضة. "فقط أدخل بضع كلمات حول سبب فقدان الدخل، وفي بضع ثوان ستحصل على فقرة رسمية مقنعة مقترحة لإضافتها إلى رسالتك"، كما تدعي الشركة.

هذه ليست سوى غيض من فيض. متى أديتيا جوشي، عالم تعلم الآلة ومهندس سابق لخدمات الويب في أمازون، صادف GPT-3 لأول مرة، وقد أذهله ما رآه لدرجة أنه أنشأ موقعًا على الويب، www.gpt3examples.com، لتتبع الأفضل.

"بعد وقت قصير من إعلان OpenAI عن واجهة برمجة التطبيقات (API) الخاصة بهم، بدأ المطورون في نشر عروض توضيحية رائعة للتطبيقات التي تم إنشاؤها باستخدام GPT-3،" قال لـ Digital Trends. "لقد كانوا جيدين بشكل مدهش. لقد قمت بإنشاء [موقع الويب الخاص بي] لتسهيل على المجتمع العثور على هذه الأمثلة واكتشاف طرق مبتكرة لاستخدام GPT-3 لحل المشكلات في مجالهم الخاص."

شخصيات اصطناعية تفاعلية بالكامل مع GPT-3 و https://t.co/ZPdnEqR0Hn 🎇

إنهم يعرفون من هم، وأين يعملون، ومن هو رئيسهم، وأكثر من ذلك بكثير. هذا ليس بوت والدك... pic.twitter.com/kt4AtgYHZL

– تايلر لاستوفيتش (@tylerlastovich) 18 أغسطس 2020

يشير جوشي إلى العديد من العروض التوضيحية التي كان لها تأثير حقيقي عليه. واحد، أ مولد التخطيطيعرض تخطيطًا وظيفيًا عن طريق إنشاء تعليمات برمجية JavaScript من وصف نصي بسيط. هل تريد زرًا مكتوبًا عليه "اشتراك" على شكل بطيخة؟ هل ترغب في بعض نصوص البانر مع سلسلة من الأزرار بألوان قوس قزح؟ ما عليك سوى شرحها في النص الأساسي، وسيقوم منشئ تخطيط شريف شميم بكتابة الكود لك. آخر، أ محرك بحث يعتمد على GPT-3 التي أنشأتها Paras Chopra، يمكنها تحويل أي استعلام مكتوب إلى إجابة ورابط URL لتوفير المزيد من المعلومات. وأخرى، معكوسة لفرانسيس جيرفيس لمايكل تيفولا، يترجم الوثائق القانونية إلى الإنجليزية البسيطة. وأخرى لرافائيل ميليير، يكتب مقالات فلسفية. وهناك شخص آخر، بقلم جويرن برانوين، يستطيع ذلك توليد الخيال الإبداعي.

قال جوشي: "لم أتوقع أن يؤدي نموذج لغة واحدة أداءً جيدًا في مثل هذه المجموعة المتنوعة من المهام، بدءًا من ترجمة اللغة وإنشاءها وحتى تلخيص النص واستخراج الكيانات". "في واحدة من تجاربي الخاصةلقد استخدمت GPT-3 للتنبؤ بتفاعلات الاحتراق الكيميائي، وكان أداؤه جيدًا بشكل مدهش.

المزيد من أين جاء ذلك

لا تنتهي الاستخدامات التحويلية لـ GPT-3 عند هذا الحد أيضًا. عالم الحاسوب تايلر لاستوفيتش وقد استخدم GPT-3 ل خلق الناس وهمية، بما في ذلك الخلفية الدرامية، والتي يمكن بعد ذلك التفاعل معها عبر الرسائل النصية. وفي الوقت نفسه، أظهر أندرو ماين أن GPT-3 يمكن أن يكون كذلك يستخدم لتحويل عناوين الأفلام إلى رموز تعبيرية. نيك والتون، كبير مسؤولي التكنولوجيا في Latitude، الاستوديو الذي ابتكر لعبة المغامرات النصية التي تم إنشاؤها بواسطة GPT منظمة العفو الدولية الزنزانة فعلت الشيء نفسه مؤخرًا لمعرفة ما إذا كان من الممكن أن تتحول سلاسل أطول من الوصف النصي في الرموز التعبيرية. وتقوم شركة Copy.ai، وهي شركة ناشئة تعمل على إنشاء أدوات كتابة النصوص باستخدام GPT-3، باستغلال النموذج بكل ما يستحقه، مع اشتراك شهري الإيرادات المتكررة 67000 دولار اعتبارًا من مارس – وجولة تمويل حديثة بقيمة 2.9 مليون دولار.

لقد أحدث التعلم الآلي تغييرًا كبيرًا في جميع أنواع الطرق على مدار العقدين الماضيين.

"بالتأكيد، كانت هناك مفاجأة والكثير من الرهبة فيما يتعلق بالإبداع الذي استخدمه الأشخاص GPT-3." سانديني أغاروال، الذكاء الاصطناعي. قال باحث السياسات في OpenAI لـ Digital Trends. "إن الكثير من حالات الاستخدام تتسم بالإبداع الشديد، وفي المجالات التي لم أتوقعها حتى، سيكون لديها الكثير من المعرفة عنها. من المثير للاهتمام أن نرى. ولكن مع ذلك، فإن GPT-3 - وهذا الاتجاه البحثي بأكمله الذي اتبعته OpenAI - كان على أمل كبير أن يمنحنا هذا الذكاء الاصطناعي. النموذج الذي كان أكثر للأغراض العامة. بيت القصيد من الذكاء الاصطناعي للأغراض العامة. النموذج هو [أنه سيكون] نموذجًا واحدًا يمكنه القيام بكل هذه الأمور المختلفة المتعلقة بالذكاء الاصطناعي. مهام."

تسلط العديد من المشاريع الضوء على إحدى القيمة المضافة الكبيرة لـ GPT-3: نقص التدريب الذي يتطلبه. لقد أحدث التعلم الآلي تحولًا في جميع أنواع الطرق على مدار العقدين الماضيين. لكن التعلم الآلي يتطلب عددًا كبيرًا من أمثلة التدريب حتى يتمكن من إخراج الإجابات الصحيحة. من ناحية أخرى، يتمتع GPT-3 "بقدرة قليلة على إطلاق النار" تسمح له بتعلم القيام بشيء ما باستخدام عدد قليل من الأمثلة فقط.

الثور معقول *** ر

GPT-3 مثير للإعجاب للغاية. لكنه يطرح تحديات أيضا. بعض هذه الأمور يتعلق بالتكلفة: بالنسبة للخدمات ذات الحجم الكبير مثل برامج الدردشة الآلية، والتي يمكن أن تستفيد من سحر GPT-3، قد تكون الأداة باهظة الثمن للغاية بحيث لا يمكن استخدامها. (يمكن أن تكلف الرسالة الواحدة 6 سنتات، وهو مبلغ ضخم بالتأكيد، على الرغم من أنه ليس بمثابة كسر للبنك).

ويتعلق البعض الآخر بتوفرها على نطاق واسع، مما يعني أنه من المحتمل أن يكون من الصعب إنشاء شركة ناشئة حصريًا لأن المنافسة الشرسة من المرجح أن تؤدي إلى انخفاض الهوامش.

والسبب الآخر هو نقص الذاكرة. تحتوي نافذة السياق الخاصة بها على ما يقل قليلاً عن 2000 كلمة في المرة السابقة، مثل شخصية جاي بيرس في الفيلم تذكار، تتم إعادة ضبط ذاكرته. وقال لاستوفيتش: "يحد هذا بشكل كبير من طول النص الذي يمكن إنشاءه، إلى فقرة قصيرة تقريبًا لكل طلب". "من الناحية العملية، هذا يعني أنه غير قادر على إنشاء مستندات طويلة مع الاستمرار في تذكر ما حدث في البداية."

ربما يكون التحدي الأكثر بروزًا يتعلق أيضًا بأكبر نقاط قوتها: قدراتها على التحادث. Confabulation هو مصطلح يستخدمه الأطباء بشكل متكرر لوصف الطريقة التي يستطيع بها بعض الأشخاص الذين يعانون من مشاكل في الذاكرة القيام بذلك اختلاق المعلومات التي تبدو مقنعة في البداية، ولكنها لا تصمد بالضرورة أمام التدقيق عند الاقتراب منها تقتيش. إن قدرة GPT-3 على التبسيط هي، حسب السياق، نقطة قوة ونقطة ضعف. بالنسبة للمشاريع الإبداعية، يمكن أن يكون رائعًا، مما يسمح له بالتطرق إلى المواضيع دون الاهتمام بأي شيء عادي مثل الحقيقة. بالنسبة للمشاريع الأخرى، يمكن أن يكون الأمر أكثر صعوبة.

يشير فرانسيس جيرفيس من شركة Augrented إلى قدرة GPT-3 على "توليد هراء معقول". نيك والتون منظمة العفو الدولية الزنزانة قال: "GPT-3 جيد جدًا في كتابة النص الإبداعي الذي يبدو أنه من الممكن أن يكتبه إنسان... أحد ومع ذلك، فإن نقاط ضعفه هي أنه يمكنه في كثير من الأحيان أن يكتب وكأنه واثق جدًا - حتى لو لم يكن لديه أي فكرة عن الإجابة على سؤال ما. السؤال هو."

العودة إلى الغرفة الصينية

في هذا الصدد، يعيدنا GPT-3 إلى الأرضية المألوفة للغرفة الصينية لجون سيرل. في عام 1980، نشر الفيلسوف سيرل أحد أشهر الذكاء الاصطناعي. تجارب الفكر، ركز على موضوع "الفهم". تطلب منا الغرفة الصينية أن نتخيل شخصًا محبوسًا في غرفة مع كتلة من الكتابة بلغة لا يفهمها. كل ما يعرفونه هو رموز مجردة. تحتوي الغرفة أيضًا على مجموعة من القواعد التي توضح مدى توافق مجموعة من الرموز مع مجموعة أخرى. بالنظر إلى سلسلة من الأسئلة التي يتعين الإجابة عليها، يجب على شاغل الغرفة مطابقة رموز الأسئلة مع رموز الإجابة. وبعد تكرار هذه المهمة عدة مرات، يصبحون ماهرين في تنفيذها - على الرغم من أنهم ليس لديهم أدنى فكرة عما تعنيه أي مجموعة من الرموز، بل فقط أن إحداهما تتوافق مع الأخرى.

الرسم التوضيحي للغرفة الصينية لجون سيرل.
الرسم التوضيحي للغرفة الصينية لجون سيرل

GPT-3 هو عالم بعيد عن أنواع الذكاء الاصطناعي اللغوي. التي كانت موجودة في الوقت الذي كان سيرل يكتب فيه. ومع ذلك، فإن مسألة التفاهم شائكة كما كانت دائما.

"هذا مجال مثير للجدل للغاية من التساؤلات، وأنا متأكد من أنك تدرك ذلك، لأن هناك الكثير من الاختلافات قال ساندهيني من OpenAI: "آراء حول ما إذا كانت النماذج اللغوية، بشكل عام، ستحظى بفهم [حقيقي] على الإطلاق". أغاروال. "إذا سألتني عن GPT-3 في الوقت الحالي، فهو يؤدي أداءً جيدًا جدًا في بعض الأحيان، ولكن ليس جيدًا في أوقات أخرى. هناك هذه العشوائية فيما يتعلق بمدى أهمية المخرجات بالنسبة لك. في بعض الأحيان قد تنبهر بالمخرجات، وفي أحيان أخرى ستكون المخرجات غير منطقية. وبالنظر إلى ذلك، في رأيي الآن... يبدو أن GPT-3 لا يفهم ذلك."

هناك تطور إضافي في تجربة الغرفة الصينية اليوم وهو أن GPT-3 لم تتم برمجته في كل خطوة بواسطة فريق صغير من الباحثين. إنه نموذج ضخم تم تدريبه على مجموعة بيانات هائلة تتكون من الإنترنت. وهذا يعني أنه يمكنه التقاط الاستنتاجات والتحيزات التي قد تكون مشفرة في النص الموجود عبر الإنترنت. هل سمعت عبارة أنك متوسط ​​الأشخاص الخمسة الذين تحيط نفسك بهم؟ حسنًا، تم تدريب GPT-3 على كميات لا يمكن فهمها تقريبًا من البيانات النصية من مصادر متعددة، بما في ذلك الكتب ويكيبيديا ومقالات أخرى. ومن هذا المنطلق، يتعلم التنبؤ بالكلمة التالية في أي تسلسل عن طريق فحص بيانات التدريب الخاصة به لرؤية مجموعات الكلمات المستخدمة من قبل. يمكن أن يكون لهذا عواقب غير مقصودة.

تغذية الببغاوات العشوائية

تم تسليط الضوء على هذا التحدي مع نماذج اللغة الكبيرة لأول مرة في ورقة رائدة في موضوع ما يسمى الببغاوات العشوائية. الببغاء العشوائي - وهو مصطلح صاغه المؤلفون، الذين ضموا بين صفوفهم القائد المشارك السابق لقسم الذكاء الاصطناعي الأخلاقي في جوجل. يشير فريق Timnit Gebru إلى نموذج لغوي كبير "[يدمج] بشكل عشوائي تسلسلات من الأشكال اللغوية التي لاحظها في بياناته التدريبية الواسعة، وفقًا لمعلومات احتمالية حول كيفية دمجها، ولكن دون أي مرجع إلى المعنى."

"بعد أن تدربنا على جزء كبير من الإنترنت، من المهم أن نعترف بأنها ستحمل بعضًا من تحيزاتها". ألبرت جوزي، قال مستخدم آخر لـ GPT-3 لـ Digital Trends. "أعلم أن فريق OpenAI يعمل بجد لتخفيف هذا الأمر بعدة طرق مختلفة، لكنني أتوقع أن تظل هذه مشكلة لبعض الوقت في المستقبل."

تتضمن إجراءات OpenAI المضادة للدفاع ضد التحيز مرشحًا للسموم، والذي يقوم بتصفية لغة أو موضوعات معينة. تعمل OpenAI أيضًا على إيجاد طرق لدمج التعليقات البشرية حتى تتمكن من تحديد المجالات التي لا ينبغي أن تبتعد عنها. بالإضافة إلى ذلك، يتحكم الفريق في الوصول إلى الأداة بحيث لا يتم منح بعض الاستخدامات السلبية للأداة حق الوصول.

"التحيز وإمكانية العوائد الصريحة موجودان تمامًا ويتطلبان جهدًا من المطورين لتجنبه."

وقال أغاروال: "أحد الأسباب وراء عدم رؤيتك لعدد كبير جدًا من هؤلاء المستخدمين الضارين هو أننا نجري عملية مراجعة مكثفة داخليًا". "الطريقة التي نعمل بها هي أنه في كل مرة تريد فيها استخدام GPT-3 في منتج سيتم نشره فعليًا، عليك أن تفعل ذلك عليك أن تمر بعملية يقوم فيها فريق - مثل فريق من البشر - بمراجعة الطريقة التي تريد استخدامها هو - هي. … وبعد ذلك، بناءً على التأكد من أنه ليس شيئًا ضارًا، سيتم منحك حق الوصول.

ومع ذلك، فإن بعض هذا يمثل تحديًا، لأسباب ليس أقلها أن التحيز ليس دائمًا حالة واضحة لاستخدام كلمات معينة. يشير جيرفيس إلى أنه في بعض الأحيان، يمكن لرسائل تأجير GPT-3 الخاصة به أن "تميل نحو القوالب النمطية المتعلقة بالجنس [أو] الطبقة الافتراضات." إذا تركت دون مراقبة، فقد تفترض الهوية الجنسية للشخص المعني في خطاب الإيجار، بناءً على عائلته الدور أو الوظيفة. قد لا يكون هذا هو المثال الأكثر خطورة على الذكاء الاصطناعي. إنه تحيز، ولكنه يسلط الضوء على ما يحدث عندما يتم استيعاب كميات كبيرة من البيانات ثم إعادة تجميعها بشكل احتمالي في نموذج اللغة.

وقال تايلر لاستوفيتش: "إن التحيز وإمكانية العائدات الصريحة موجودان بالتأكيد ويتطلبان بذل جهد من المطورين لتجنبه". "تشير OpenAI إلى نتائج قد تكون سامة، ولكنها في النهاية تضيف مسؤولية يجب على العملاء التفكير فيها مليًا قبل وضع النموذج في مرحلة الإنتاج. إحدى الحالات الصعبة التي يصعب تطويرها على وجه التحديد هي ميل النموذج إلى الكذب، لأنه ليس لديه مفهوم للمعلومات الصحيحة أو الخاطئة.

نماذج اللغة ومستقبل الذكاء الاصطناعي

بعد تسعة أشهر من ظهوره لأول مرة، من المؤكد أن GPT-3 يرقى إلى مستوى توقعاته باعتباره يغير قواعد اللعبة. إن ما كان ذات يوم إمكانات بحتة قد أثبت أنه يمكن تحقيقه. يسلط عدد حالات الاستخدام المثيرة للاهتمام لـ GPT-3 الضوء على كيفية إنشاء الذكاء الاصطناعي لإنشاء النص. هو أكثر تنوعًا بكثير مما قد يوحي به هذا الوصف.

GPT-2 مولد نص AI
OpenAI

لا يعني ذلك أنه الطفل الجديد في المنطقة هذه الأيام. في وقت سابق من هذا العام، تم تجاوز GPT-3 كأكبر نموذج لغوي. أطلق Google Brain نموذجًا جديدًا للغة مع حوالي 1.6 تريليون معلمةمما يجعله تسعة أضعاف حجم عرض OpenAI. ومن غير المرجح أن يكون هذا نهاية الطريق لنماذج اللغة. وهذه أدوات قوية للغاية - ولديها القدرة على إحداث تحول في المجتمع، ربما للأفضل أو للأسوأ.

من المؤكد أن هناك تحديات تواجه هذه التقنيات، وهي تحديات يجب على شركات مثل OpenAI والباحثين المستقلين وغيرهم الاستمرار في معالجتها. ولكن في المجمل، من الصعب القول بأن النماذج اللغوية لم تتحول إلى واحدة من أكثر المجالات إثارة للاهتمام والأكثر أهمية في أبحاث الذكاء الاصطناعي.

من كان يظن أن مولدات النصوص يمكن أن تكون في غاية الأهمية؟ مرحبا بكم في مستقبل الذكاء الاصطناعي.

توصيات المحررين

  • التناظرية منظمة العفو الدولية؟ قد يبدو الأمر جنونيًا، لكنه قد يكون المستقبل
  • اقرأ "الكتاب المقدس الاصطناعي" الجميل والمخيف للذكاء الاصطناعي. الذي يعتقد أنه الله
  • العمارة الخوارزمية: هل يجب أن نسمح للذكاء الاصطناعي تصميم المباني بالنسبة لنا؟
  • Women with Byte: خطة Vivienne Ming لحل "المشاكل الإنسانية الفوضوية" باستخدام الذكاء الاصطناعي.
  • لماذا قد يكون تعليم الروبوتات لعبة الغميضة هو المفتاح للجيل القادم من الذكاء الاصطناعي