ربما كنت على دراية التزييف العميق، "الوسائط الاصطناعية" المعدلة رقميًا والقادرة على خداع الأشخاص لرؤية أو سماع أشياء لم تحدث أبدًا في الواقع. تشبه الأمثلة العدائية التزييف العميق للتعرف على الصور بواسطة الذكاء الاصطناعي. الأنظمة - وعلى الرغم من أنها لا تبدو غريبة بعض الشيء بالنسبة لنا، إلا أنها قادرة على إرباك الآلات.
محتويات
- صد الهجمات المعادية
- لا يزال هناك المزيد من العمل الذي يتعين القيام به
قبل عدة سنوات، وجد باحثون في مختبر علوم الكمبيوتر والذكاء الاصطناعي (CSAIL) التابع لمعهد ماساتشوستس للتكنولوجيا أن يمكنهم خداع حتى خوارزميات التعرف على الصور المعقدة وتحويلها إلى كائنات مربكة ببساطة عن طريق تغيير سطحها قليلاً نَسِيج. لم تكن هذه اختلاطات بسيطة أيضًا.
وفي العرض التوضيحي الذي قدمه الباحثون، أظهروا أنه من الممكن الحصول على شبكة عصبية متطورة للنظر إلى سلحفاة مطبوعة ثلاثية الأبعاد ورؤية بندقية بدلاً من ذلك. أو أن تنظر إلى كرة البيسبول وتستنتج أنها قهوة إسبرسو. إذا ظهر مثل هذا العمه البصري في الإنسان، فسيكون ذلك نوعًا من دراسة الحالة العصبية التي قد تجد طريقها إلى كتاب مثل كتاب أوليفر ساكس الكلاسيكي. الرجل الذي حسب زوجته قبعة.
مقاطع الفيديو الموصى بها
تمثل الأمثلة العدائية ثغرة أمنية رائعة عندما يتعلق الأمر بكيفية عمل الذكاء الاصطناعي البصري. الأنظمة ترى العالم. لكنها أيضًا، كما قد تتوقع من الخلل الذي يخلط بين لعبة السلحفاة الجديدة والبندقية، تمثل عيبًا مثيرًا للقلق. إنها مشكلة كان الباحثون يائسين يحاولون اكتشاف كيفية تصحيحها.
الآن، توصلت مجموعة أخرى من الباحثين من معهد ماساتشوستس للتكنولوجيا إلى نظام جديد يمكن أن يساعد في تجنب المدخلات "العدائية". وفي هذه العملية، تصوروا حالة استخدام مرعبة بصراحة للأمثلة العدائية، وهي حالة يمكن استخدامها لإحداث تأثير مميت إذا تم تنفيذها من قبل المتسللين.
السيناريو هو كما يلي: تتحسن السيارات ذاتية القيادة في إدراك العالم من حولها. ولكن ماذا لو أصبحت الكاميرات القائمة على المدخلات المرئية الموجودة على متن السيارة، فجأة، إما عن قصد أو عن غير قصد غير قادرة على تحديد ما هو أمامها؟ إن التصنيف الخاطئ لجسم ما على الطريق - مثل الفشل في تحديد هوية أحد المشاة ومكانه بشكل صحيح - قد يؤدي إلى نتائج سيئة للغاية بالفعل.
صد الهجمات المعادية
"لقد عملت مجموعتنا على واجهة التعلم العميق والروبوتات ونظرية التحكم لعدة سنوات - بما في ذلك العمل على استخدام التعلم المعزز العميق لتدريب الروبوتات على التنقل بطريقة واعية اجتماعيًا حول المشاة. مايكل ايفرت، باحث ما بعد الدكتوراه في قسم الطيران والملاحة الفضائية بمعهد ماساتشوستس للتكنولوجيا، لـ Digital Trends. "بينما كنا نفكر في كيفية تطبيق هذه الأفكار على مركبات أكبر وأسرع، أصبحت مسائل السلامة والمتانة هي التحدي الأكبر. لقد رأينا فرصة عظيمة لدراسة هذه المشكلة في التعلم العميق من منظور التحكم القوي والتحسين القوي.
تخطيط الحركة الواعي اجتماعيًا مع التعلم المعزز العميق
التعلم المعزز هو نهج قائم على التجربة والخطأ في التعلم الآلي، وقد استخدمه الباحثون بشكل مشهور من أجل الحصول على أجهزة الكمبيوتر لتعلم كيفية لعب ألعاب الفيديو دون أن يتم تعليمه صراحة كيف. يُطلق على التعلم المعزز الجديد للفريق والخوارزمية المستندة إلى الشبكة العصبية العميقة اسم CARRL، وهو اختصار لعبارة "المتانة التنافسية المعتمدة للتعلم المعزز العميق". في جوهرها، انها الشبكة العصبية مع جرعة إضافية من الشك عندما يتعلق الأمر بما يراه.
في أحد العروض التوضيحية لعملهم، والذي دعمته شركة Ford Motor Company، قام الباحثون ببناء خوارزمية تعلم معززة قادرة على لعب لعبة Atari الكلاسيكية بونغ. ولكن، على عكس لاعبي لعبة RL السابقين، في نسختهم، قاموا بتطبيق هجوم عدائي أدى إلى طرد الذكاء الاصطناعي. تقييم الوكيل لموضع الكرة في اللعبة، مما يجعله يعتقد أنها أقل ببضعة بكسلات مما هي عليه في الواقع كان. عادةً، هذا من شأنه أن يضع الذكاء الاصطناعي. اللاعب في وضع غير مؤاتٍ للغاية، مما يتسبب في خسارته بشكل متكرر أمام خصم الكمبيوتر. ومع ذلك، في هذه الحالة، يفكر وكيل RL في جميع أماكن الكرة استطاع كن، ثم ضع المجداف في مكان ما حيث لن يخطئ بغض النظر عن التغيير في موضعه.
"ستكون هذه الفئة الجديدة من خوارزميات التعلم العميق القوية ضرورية لتحقيق الذكاء الاصطناعي الواعد. التقنيات في العالم الحقيقي."
وبطبيعة الحال، تعتبر الألعاب أكثر بساطة من العالم الحقيقي إلى حد كبير، كما يعترف إيفريت بسهولة.
"يحتوي العالم الحقيقي على قدر أكبر من عدم اليقين من ألعاب الفيديو، وذلك بسبب أجهزة الاستشعار غير الكاملة أو الهجمات العدائية، والتي يمكن أن تكون كافية لخداع التعلم العميق. أنظمة لاتخاذ قرارات خطيرة - [مثل] رش نقطة على الطريق [مما قد يتسبب في انحراف السيارة ذاتية القيادة] إلى مسار آخر". شرح. "يقدم عملنا خوارزمية RL عميقة تتميز بأنها قوية بشكل موثوق للقياسات غير الكاملة. الابتكار الرئيسي هو أن الخوارزمية تفكر بدلاً من الثقة العمياء في قياساتها، كما هو الحال اليوم من خلال جميع القياسات الممكنة التي كان من الممكن إجراؤها، ويتخذ القرار الذي يعتبر أسوأ الحالات حصيلة."
وفي عرض توضيحي آخر، أظهروا أن الخوارزمية يمكنها، في سياق محاكاة القيادة، تجنب الاصطدامات حتى عندما تتعرض مستشعراتها للهجوم من قبل خصم يريد أن يصطدم العامل. "ستكون هذه الفئة الجديدة من خوارزميات التعلم العميق القوية ضرورية لتحقيق الذكاء الاصطناعي الواعد. قال إيفريت: "التقنيات في العالم الحقيقي".
لا يزال هناك المزيد من العمل الذي يتعين القيام به
لا يزال الوقت مبكرًا لهذا العمل، وهناك المزيد الذي يتعين علينا القيام به. هناك أيضًا مشكلة محتملة تتمثل في أن هذا قد يؤدي، في بعض السيناريوهات، إلى حدوث خلل في الذكاء الاصطناعي. يتصرف الوكيل بشكل متحفظ للغاية، مما يجعله أقل كفاءة. ومع ذلك، فهو بحث قيم يمكن أن يكون له تأثيرات عميقة في المستقبل.
"[هناك مشاريع بحثية أخرى] تركز على الحماية ضد [أنواع معينة] من الأمثلة العدائية، حيث تتمثل مهمة الشبكة العصبية في قال إيفريت، عندما سُئل عن لعبة السلحفاة مقابل البندقية الكلاسيكية: "قم بتصنيف صورة ما وتكون إما صحيحة أو خاطئة، وتنتهي القصة عند هذا الحد". مشكلة. "يعتمد عملنا على بعض هذه الأفكار، ولكنه يركز على التعلم المعزز، حيث يتعين على الوكيل اتخاذ الإجراءات والحصول على بعض المكافأة إذا قام بعمل جيد. لذلك نحن ننظر إلى سؤال طويل المدى وهو "إذا قلت أن هذه سلحفاة، فما هي الآثار المستقبلية لهذا القرار؟" وهذا هو المكان الذي يمكن أن تساعد فيه خوارزميتنا حقًا. ستفكر الخوارزمية الخاصة بنا في أسوأ النتائج المستقبلية لاختيار إما سلحفاة أو بندقية يمكن أن تكون خطوة مهمة نحو حل المشكلات الأمنية المهمة عندما يقوم الذكاء الاصطناعي. قرارات الوكلاء لها مدة طويلة تأثير."
ورقة تصف البحث هي متاح للقراءة على مستودع ما قبل الطباعة الإلكتروني arXiv.
توصيات المحررين
- التناظرية منظمة العفو الدولية؟ قد يبدو الأمر جنونيًا، لكنه قد يكون المستقبل
- إليك ما يقوله الذكاء الاصطناعي الذي يقوم بتحليل الاتجاه. يعتقد أنه سيكون الشيء الكبير التالي في مجال التكنولوجيا
- كاليفورنيا لديها مشكلة انقطاع التيار الكهربائي. هل يمكن أن تكون بطاريات التدفق العملاقة هي الحل؟
- العمارة الخوارزمية: هل يجب أن نسمح للذكاء الاصطناعي تصميم المباني بالنسبة لنا؟
- استشعار العاطفة موجود هنا، ويمكن أن يكون في مقابلة العمل القادمة