زار باحث في Google Brain مؤخرًا الباحث في Google Brain فصل الصف الثاني من ابنته مع حمولة غير عادية : مجموعة من الصور المخدرة المليئة بالأشكال غير المفهومة ودبابيس ملوّثة من اللون . لقد مررهم حول الفصل الدراسي ، وكان سعيدًا عندما اعتبر الطلاب بسرعة أحد النقطتين كأذن كلب . كانت مجموعة من الأطفال البالغين من العمر 7 سنوات قد قاموا بفك رموز الرؤى الداخلية للشبكة العصبية .
كارتر من بين الباحثين الذين يحاولون اختراق "الصندوق الأسود" للتعلم العميق . أثبتت الشبكات العصبية نجاحًا هائلًا في مهام مثل تحديد الأشياء في الصور ، ولكن كيف أنها تفعل ذلك تظل غامضة إلى حد كبير . أعمالهم الداخلية محصنة من أعين بشرية ، مدفونة في طبقات من الحسابات ، مما يجعل من الصعب تشخيص الأخطاء أو التحيزات . في يوم الأربعاء ، أصدر فريق كارتر ورقة تعرض نظرة خاطفة بالداخل ، تبين كيف تقوم الشبكة العصبية ببناء المفاهيم البصرية وترتيبها .
ويرجع تاريخ هذا البحث إلى عام 2015 ، عندما ساعد كريس أولاه ، المؤلف المشارك لكارتر ، في تصميم برنامج Deep Dream ، وهو برنامج حاول تفسير الشبكات العصبية عن طريق الهندسة العكسية . قام فريق Olah بتدريس شبكة عصبية للتعرف على مجموعة من الكائنات باستخدام ImageNet ، وهي قاعدة بيانات ضخمة من الصور . ثم أخبروا الشبكة بأنهم ، على سبيل المثال ، يولدون كلبًا أو شجرة بناءً على ما "تعلموه" . كانت النتائج عبارة عن صور مهلوسة تعكس ، بشكل محدود ، كيف "رأى النموذج" المدخلات التي تم إدخالها فيه. (تبين لاحقا أن النظام يمكن أن ينتج أيضا أعمال فنية باهظة الثمن) .
ومنذ ذلك الحين ، عملت أولاه ، التي تدير الآن فريقاً في معهد الأبحاث OpenAI المكرس لتفسير الذكاء الاصطناعي ، على جعل هذه الأنواع من التصوير أكثر فائدة . تتكون الشبكات العصبية من طبقات من ما يسميه الباحثون الخلايا العصبية ، التي تطلق استجابة لجوانب معينة من الصورة . بالنسبة لكل مستوى من الشبكة ، جمع كارتر وأولاه مجموعة من الصور التي تسببت في إطلاق نفس المجموعة من الخلايا العصبية . بعد ذلك ، كما هو الحال مع Deep Dream ، قام الباحثون بإعادة بناء صورة كان من شأنها أن تسبب في إطلاق العصبونات بالطريقة التي فعلوها : في المستويات الدنيا ، قد يؤدي ذلك إلى توليد ترتيب غامض من البكسلات. في مستويات أعلى ، صورة مشوهة لنبض الكلب أو زعنفة القرش . رتبوا مجموعات مماثلة بالقرب من بعضهم البعض ، واصفا الخريطة الناتجة بـ "أطلس التنشيط" .
يتيح هذا للباحثين ملاحظة بعض الأمور المتعلقة بالشبكة . من خلال التبديل بين طبقات مختلفة ، يمكنهم رؤية كيف تبني الشبكة نحو قرار نهائي ، من المفاهيم البصرية الأساسية مثل الشكل والملمس إلى الكائنات المنفصلة . لاحظت أولاه ، على سبيل المثال ، أن سلالات الكلاب (ImageNet تضم أكثر من 100) تتميز إلى حد كبير بمدى آذانهم المرنة . كما يبين الأطلس كيف ترتبط الشبكة بأشياء وأفكار مختلفة - على سبيل المثال ، عن طريق وضع آذان الكلاب ليس بعيدًا جدًا عن آذان القطط ، وكيف تصبح تلك الفروق أكثر وضوحًا مع تقدم الطبقات .
يقول جيف كلون ، الأستاذ في جامعة وايومنغ الذي لم يشارك في الدراسة ، إن الأطلس هو خطوة مفيدة للأمام ولكنه ذو فائدة محدودة في الوقت الحالي . ويشير إلى أن الباحثين الذين يحاولون فهم كيفية عمل الشبكات العصبية يخوضون معركة خاسرة ، مع تزايد تعقيد الشبكات والاعتماد على مبالغ هائلة من الطاقة الحاسوبية . ويقول : "لقد تجاوزت هذه الزيادة حتى الآن قدرتنا على ابتكار التقنيات التي تجعلها قابلة للتفسير لنا" .
كما كشف البحث عن بعض المفاجآت . كدليل على ذلك ، تسحب Olah صورة مشؤومة لشق الزعانف في المياه الغائرة : هل تنتمي إلى حوت رمادي أو سمكة قرش بيضاء كبيرة؟ نظرًا لأن الإنسان لا يتمتع بالخبرة الكافية في الصيد ، فلن أخاطر بتخمين ، ولكن الشبكة العصبية التي ترى الكثير من زعانف سمك القرش والحيتان يجب ألا تواجه مشكلة . ثم يعرض لي صور الأطلس المرتبطة بالحيوان على مستوى معين من الشبكة العصبية - وهي خريطة تقريبية للمفاهيم البصرية التي تعلمتها لربطها بها . إحدى صور القرش غريبة بشكل خاص . إذا كنت تعانين من الحول قليلاً ، قد ترى صفوفًا من الأسنان البيضاء واللثة - أو ربما ، طبقات من لعبة البيسبول .


وتبين أن الشبكة العصبية التي درسوها لديها أيضاً هدية لمثل هذه الاستعارات البصرية ، التي يمكن استخدامها كحيلة رخيصة لخداع النظام . من خلال التلاعب في صورة الزعنفة - على سبيل المثال ، في صورة ختم بريدي لبوليسبول في إحدى الزوايا ، وجد كارتر وأولاه أنه يمكنك بسهولة إقناع الشبكة العصبية بأن الحوت كان ، في الواقع ، سمكة قرش .

صحيح أن أولاه تقول أنه من غير المحتمل أن يتم استخدام هذه الطريقة من قبل المخربين البشريين . هناك طرق أسهل وأكثر دهاء للتسبب في مثل هذه الفوضى . يمكن أن يتم إنشاء ما يسمى بقع العدائية بشكل تلقائي للتشويش على شبكة ما للتفكير في أن القطة عبارة عن وعاء من جواكامولي ، أو حتى تجعل السيارات ذاتية القيادة تخطئ في قراءة إشارات التوقف .
لكنه يجد أنه من المثير أن البشر يمكنهم تعلم ما يكفي عن الأعماق الداخلية للشبكة ، في جوهرها ، أن يفسدوا معها. ويقول إن الأمل هو أن النظر إلى الشبكات العصبية قد يساعدنا في النهاية على تحديد الارتباك أو التحيز ، وربما تصحيحه . الشبكات العصبية عادة ما تكون ممتازة في تصنيف الأشياء في صور ثابتة ، ولكن التقلبات شائعة - على سبيل المثال ، في تحديد البشر من أعراق مختلفة مثل الغوريلا وليس البشر . مع أدوات التصور مثله ، يمكن للباحث أن ينظر ويبحث في المعلومات الغريبة ، أو أوجه التشابه المرئي ، مما جعله يخطئ .


ومع ذلك ، هناك مخاطر لمحاولة إحاطة أحشاء الشبكة العصبية . تقول أولاه : "مع عمل التفسير ، غالبًا ما يكون هناك قلق من أنك ربما تخدع نفسك" . يتمثل الخطر في أننا قد نحاول فرض مفاهيم مرئية مألوفة بالنسبة لنا أو البحث عن تفسيرات سهلة ذات معنى .

هذا أحد الأسباب التي جعلت بعض الشخصيات ، بما في ذلك رائد منظمة العفو الدولية جيف هينتون ، تنذر بالاعتماد على الكثير من التفسيرات البشرية لتفسير سبب قيام منظمة العفو الدولية بما تقوم به . فكما لا يستطيع البشر تفسير كيفية اتخاذ أدمغتهم للقرارات ، فإن أجهزة الكمبيوتر تصطدم بنفس المشكلة . وكما صرحت هينتون في مقابلة أخيرة مع WIRED ، "إذا طلبت منهم توضيح قرارهم ، فأنت تجبرهم على تكوين قصة" .
المصادر
Share To:

محمد حسن

Post A Comment:

0 comments so far,add yours