حتى الذكاء الصناعي رسب في امتحان الرياضيات!

هل تستطيع حل هذه المعادلة: 1+1+1+1+1+1+1 = ؟؟
إذا كان جوابك سبعة فأنت على حق، وأنت أيضًا أذكى من أنظمة الذكاء الصناعي!

نشر باحثون في الذكاء الصناعي من شركة Deep Mind التابعة لـGoogle هذا الأسبوع بحثًا حاولوا فيه تدريب حواسيب التعلم الذاتي (أو ما يعرف بالشبكات العصبية الصناعية) على حل المسائل الأساسية في الحساب والجبر وحساب التفاضل والتكامل وأنواع المسائل التي يتم اختبار طلاب المدرسة الثانوية فيها.

لكن الحواسيب لم تكن جيدة في هذا الاختبار إضافة إلى تخميناتها الخاطئة (أجابت بستة مثلًا على السؤال أعلاه!)، وقد أجابت إجابة صحيحة على 14 فقط من 40 سؤال في اختبار قياسي؛ وهو ما يعادل درجة E لشخص يبلغ من العمر ستة عشر عامًا في النظام المدرسي البريطاني.

ونُشرت الورقة البحثية تحت اسم “تحليل قدرات التفكير الرياضي للنماذج الشبكية” كي توثق التجربة بحيث يمكن للآخرين إعادة بناء التجربة من أجل تطوير شبكات قابلة لتعلم الرياضيات. وقد تم نشر الورقة التي ألفها ديفيد ساكستون وإدوارد جريفنستيت وفيليكس هيل وبوشميت كولي التابعين لــ Deep Mind، على arXiv.

ويشير مؤلفو الدراسة إلى “هشاشة” شبكات الذكاء الصناعي ويناقشون أسباب قدرة البشر على أداء “التفكير المنفصل حول الأشياء والكيانات” والذي يتم تعميمه جبريًا.
ويقترحون مجموعة متنوعة من مسائل الرياضيات التي تؤدي بالشبكات العصبية للحصول على مثل هذا المنطق، والتي تتضمن أشياء مثل “التخطيط (على سبيل المثال، تعيين التنسيق الصحيح للتوابع لتشكيلها)”.

ويضيفون أنه لابد أن يكون من الصعب على النموذج أن يحقق نتائج جيدة باستخدام مجموعة من أنواع المسائل ومن بينها التعميم ودون امتلاك جزء على الأقل من القدرات التي تسمح بالتعميم الجبري .

إعلان

في تجربتهم، عالج الباحثون مجموعة كبيرة من الأسئلة لم يكن أي منها يتعلق بالهندسة ولم يكن أي منها أسئلة لفظية، من النوع التالي مثلاً:

Solve     -42*r + 27*c = -1167    and      130*r + 4*c = 372    for r. 

Answer: 4

كان أساس الأسئلة هو نموذج قياسي للرياضيات المدرسية (حتى سن 16)، يقتصر على الأسئلة النصية (وبالتالي يستبعد أسئلة الهندسة)، والذي قدّم مجموعة شاملة من موضوعات الرياضيات. وأشاروا إلى أنه لتدريب نموذج ما، كان بإمكانهم إعطاءه بعض قدرات الرياضيات الأساسية، لكن الهدف من العملية برمتها هو أن يبدأ التعلم من لا شيء وتبني الآلة قدرتها الرياضياتية.

شيّد المؤلفون نوعين مختلفين من الشبكات العصبية “الحديثة” لتحليل هذه الأسئلة وتضمينها. إحداها كانت عبارة عن “ذاكرة طويلة المدى” أو LSTM ، وهي شبكة عصبية تتفوق في التعامل مع أنواع متسلسلة من البيانات، والأخرى ما يسمى بـ “Transformer” ، وهو نمط أحدث من الشبكات العصبية المتكررة التي تم تطويرها في Google والتي أصبحت شائعة جدًا في مجموعة من المهام المختلفة.

وقد أعطوا هذه الشبكات العصبية بعض الوقت للتفكير، حيث “قد يكون من الضروري للنماذج أن تستهلك بعض الوقت لدمج المعلومات الموجودة في السؤال.

لكن النتائج كانت مخيبة، فعلى سبيل المثال في السؤال الذي طرحناه في المقدمة، استطاعت الآلات التعرف على النموذج 1+1+1+…. واستطاعت بنجاح الإجابة على كل المسائل طالما كان عدد “الواحدات” أقل من سبعة، لكنها فشلت في الإجابة على مجموع سبعة واحدات أو أكثر!

لماذا حدث هذا؟

كما هو الحال في كثير من الأحيان مع الشبكات العصبية، يبدو أن هنالك شيء يجري خلف الكواليس، لأن الشبكات كانت قادرة على القيام بعمل جيد عند إضافة أرقام أكبر بكثير معًا وفي تسلسلات أطول، مثل مجموع -34+53-936 وما إلى ذلك..

يقول الباحثون أنهم لا يملكون تفسيرًا جيدًا لهذا السلوك ويفترضون أن الشبكات العصبية تخلق طرقًا فرعية خلال طريقها للحل، لأنها تحلل الأسئلة وتعمل عليها.

بشكل عام، حققت الشبكات العصبية أفضل أداء في أشياء مثل العثور على “قيمة المكان” بعدد طويل، على سبيل المثال، اختيار مكان “العشرات” في عدد مثل 9343012. وكانت جيدة أيضًا في تقريب الأرقام العشرية وترتيب الأرقام.

إعلان

مصدر مصدر الترجمة
فريق الإعداد

إعداد: بشار منصور

اترك تعليقا