هاني الغانم: الذكاء الاصطناعي يهزم أبطال العالم في الشطرنج

image

ما العلاقة بين الذكاء الاصطناعي ولعبة الشطرنج؟ من سيفوز ذكاء البشر أم ذكاء الروبوتات؟ ماذا بين بطلة العمل الدرامي" أنيا تايلور" وIBM؟

تساؤلات عديدة تجد إجابتها لدينا:

أولاً: ما هو The queen’s gambit ولماذا أصبح الأكثر مشاهدة؟

The queen’s gambit هو أحد آخر إصدارات نيتفلكس الأصلية، مقتبس عن رواية بنفس الاسم كتبها والتر تيفس في عام 1983 والذي بنى قصتها على لحظات من حياته الشخصية، إدمانه ومحاولاته للهروب واهتمامه بدراسة تقنيات الشطرنج الحديثة، يشرح تيفس الطبيعة الهوسية لبطلته بيث بأن الناس يأخذون ممارسة الشطرنج بجدية عندما يعانون من مشكلات شخصية، عندما يحاولون الابتعاد عن شيء ما في الحياة، مثل التخلص من القلق عن طريق إعادة موضعته في شيء آمن نسبيًا.

يتعامل المسلسل القصير مع تيمات الهروب تلك كما أنه لا يمكن إغفال كونه يحكي قصة تفوق فتاة في لعبة يسيطر عليها الرجال لكنه لا يجعل ذلك اهتمامه الأساسي، يمثل العمل دراسة شخصية لطبيعة الفقد ومحاولات البعث من جديد في قالب مألوف لكنه يملك من الحيوية ما يجعله مثيرًا في كل جانب رغم طبيعة اللعبة غير جماهيرية.

إذاً، ما الرابط بين المسلسل وبين الذكاء الاصطناعي؟

يبدأ وجه الشبه عندما حاول بعض عمالقة التكنولوجيا إحلال الذكاء الاصطناعي محل ذكاء الإنسان. رغم أن العديد من المحاولات باءت بالفشل، إلا أن IBM الأمريكية صاحبة الأكثر من 350.000 موظف تمكنت من تحقيق ذلك عندما صممت برنامج وكمبيوتر ضخم يسمى "Deep blue" مخصص للعبة الشطرنج فقط.

حاسوب ديب بلو - هو حاسوب فائق متخصص في لعبة الشطرنج من خلال إضافة دوائر محددة تم تطوريها في بداية التسعينات من القرن الماضي، من أنتاج شركة اي بي ام IBM يستخدم تقنية المعالجة التفرعية الشاملة لحل المشاكل. يستخدم هذا الحاسوب 256 معالجا، بارز بطل العالم في الشطرنج غاري كاسباروف ثلاث مرات انهزم في الأولى 1989 وفي الثانية سنة 1996 بنتيجة (2-4) ثم فاز في مباراة الانتقام من ستة أدوار في 11 مايو 1997 بنتيجة ( 3,5 -2,5) اتهم كاسباروف IBM بالغش وطالب بمباراة انتقام، ولكن شركة IBM رفضت و قامت بتفكيك ديب بلو.

ارتفع سعر أسهم الشركة المنتجة له في سوق الأسهم بحوالي 18 مليار دولار.

كان نظام ديب بلو يستمد قوة لعبه بالأساس من القوة الإجمالية التي يحسبها النظام المركزي، و كان قادراً على حساب 200,000،000 موقف في الثانية، أسرع مرتين من نسخة 1996.

المزيد عن خوارزميات لعبة الشطرنج:

شجرة القرار (Decision Tree) هي أداة دعم قرار تستخدم رسمًا توضيحيًّا شبيها بالشجرة للقرارات والتبعات المتوقعة لها، متضمناً احتمال تحقق المخرجات، وكلفة الموارد، والمنفعة. هي رسم باتجاه واحد لعرض الخوارزمية. تستخدم شجرة القرارات عموماً في بحوث العمليات، خصوصاً في تحليل القرارات للمساعدة في تحديد الاستراتيجية التي ستؤدي لتحقيق الهدف.

عادة ما تستخدم شجرة القرار في بحوث العمليات وإدارة العمليات. في الحياة العملية، إذا كان يجب اتخاذ القرار دون إمكانية سحبه في ظل المعرفة غير الكاملة، يجب اعتماد شجرة القرار بالتوازي مع نموذج الاحتمالات كأفضل نموذج للاخيتار أو خوارزمية الاختيار. من الاستخدامات الأخرى لشجرة القرار هي اعتبارها أداة وصفية لاحتساب الاحتمال الشرطي.

يتم تعليم شجرة القرار، مخطط التأثير، دوال المنفعة وباقي أدوات وطرق تحليل القرار للطلاب في المدارس والكليات التي تدرِّس إدارة الأعمال والاقتصاد والصحة العامة وهي أمثلة عن بحوث العمليات أو طرائق علم الإدارة.

ما هي آلية عمل الخوارزمية التي تمثل طريقة تفكير البشر عند لعب الشطرنج؟

تأتي من بين أهم الخوارزميات المطبقة أثناء لعب الشطرنج MinMax وAlpha zero

تساعد تلك الخوارزميات الحاسوب على تحديد الحركة الأفضل وفقًا لمجريات اللعب ويتم ذلك من خلال بناء شجرة القرارات. ودائمًا ما تكون بداية تلك الشجرة حركة اللون الأبيض حسب قواعد اللعبة ثم يبدأ اللون الأسود يليه الأبيض وهكذا حتى نهاية اللعبة أو ما تم تحديده من مستويات.

كيف يمكنني بناء شجرة خاصة بي وكيف أحدد لها قيم؟

هناك طريقة سهله تعتمد على وزن كل قطعة شطرنج؛ الجندي يكون وزنه 1، و الفيل و الحصان 3، والقلعة ،5 و الوزير 9، أما الملك تكون قيمته الأعلى بما يساوي 1000 مثلاً لأن موته يعني انتهاء اللعبة.

ووزن كل نقطة بشجرة القرار أو شجرة الاحتمالات هي مجموع وزن كل قطع الأبيض مطروح منها وزن كل قطع الأسود

لذا، إذا كان الكمبيوتر يلعب باللون الابيض يكون هدف الخوارزمية زيادة قيم والوزن الأكتر للأبيض وتقليل الوزن الموجود عند الأسود.

ألفا زيرو

ما هو؟

 هو برنامج حاسوب طورته شركة ديب مايند المتخصصة في أبحاث الذكاء الاصطناعي من أجل إتقان ألعاب الشطرنج والشوغي وغو. وتستخدم خوارزميته منهجا مماثلا لمنهج ألفاغو زيرو .

أصدر فريق ديب مايند في 5 ديسمبر 2017 مطبوعة أولية عرّف فيها عن ألفازيرو، الذي حقق بعد 24 ساعة من التدريب مستوى لعب فاق مستوى البشر في هذه الألعاب الثلاثة وذلك بهزيمة البرامج أبطال العالم ستوكفيش  وإلمو ونسخة 3 أيام من ألفاغو زيرو.

يتكون ألفا زيرو من جزئيين رئيسيين:

  1. Deep Neural Network: يشبه أداؤه العقل البشري.
  2. General reinforce learning algorithm: يعتمد على مبدأالثواب و العقاب؛ كلما نجحت الخوارزمية في اتخاذ خطوة صحيحة تربح نقطة للتحفيز وكلما اتخذت الخورزمية خطوة خاطئة يُخصم منها نقطة. 
استخدم ألفازيرو في كل حالة وحدات معالجة موتر (TPUs) مخصصة كانت برامج غوغل قد أُمثِلت لاستخدامها. تدرب ألفازيرو عبر "اللعب مع الذات" فقط باستخدام 5000 وحدة معالجة موتر من الجيل الأول لتوليد المباريات و64 وحدة معالجة موتر من الجيل الثاني لتدريب الشبكات العصبية، كل هذا بالتوازي مع عدم الوصول إلى كتب الافتتاحيات أو جداول نهاية اللعب. بعد أربع ساعات من التدريب، قدَّرت ديب مايند أن ألفازيرو كان يلعب الشطرنج بتصنييف إيلو أكبر من ستوكفيش 8، وبعد تسع ساعات من التدريب هزمت الخوارزميةُ ستوكفيش 8 في مقابلة موقتة من 100 مباراة (28 فوز، 0 خسارة و72 تعادل). لعبت خوارزمية ألفازيرو المدربة على آلة وحيدة تملك أربع وحدات معالجة موتر.

لمشاهدة الفيديو كاملاً، اضغط الرابط:

https://www.youtube.com/watch?v=56KOYzsMWso
اقرأ أيضًا:

هاني الغانم: دع عينيك تتحدث مع أحدث تطبيقات جوجل “Look to Speak”!

للتقديم على أحدث وظائف تكنولوجيا المعلومات، اضغط هنا.

الأكثر قراءة