"كلما تقدم مجال الذكاء الاصطناعي، أصبح من الأسهل على هذه الشبكات خداعنا والتظاهر بأنها مشابهة جدًا في سلوكها للبشر. ولكن عندما نقوم بتنشيط الأدوات المناسبة، يمكننا أن نرى أنه لا تزال هناك طريقة لخداعنا". ننتقل حتى نصل إلى خوارزميات تحاكي السلوك البشري بدقة شديدة
في الحوار مع روبوتات الدردشة، أي مع الشبكات التي تعالج اللغة، يبدو في كثير من الأحيان أن هناك إنسانًا على الجانب الآخر من الدردشة. اختبر باحثون من جامعة بن غوريون في النقب وجامعة كولومبيا ما إذا كانت هذه الشبكات تفهم اللغة وتعالجها مثل البشر، ووجدوا فجوات مثيرة للدهشة. ونشرت نتائج البحث في المجلة المرموقة المخابرات آلة الطبيعة.
عند دراسة معالجة الجمل في اللغة الإنجليزية بين البشر وبين أنظمة التعلم العميق (الشبكات العصبية الاصطناعية)، يبدو أن هناك تشابهًا مدهشًا بين البشر والشبكات. هذه الحقيقة أزعجتك الدكتور طال الجولان من قسم العلوم المعرفية والدماغية في جامعة بن غوريون في النقب ماثيو سيجلمان، وهو طالب بحث من جامعة كولومبيا، حيث أن هناك اختلافات كبيرة بين الشبكات المختلفة وكذلك بين طريقة بناء هذه الشبكات وتشغيلها، والدماغ البشري. وأوضح الدكتور جولان: "إذا فهمنا بشكل أفضل أوجه التشابه والاختلاف بين الذكاء الاصطناعي والذكاء الطبيعي، فيمكننا أن نفهم بشكل أفضل كيف نعمل بأنفسنا".
إحدى الأدوات الرئيسية في البحث اللغوي هي فحص الجمل التي ينظر إليها المتحدثون باللغة على أنها "مقبولة". على سبيل المثال، "دانا أكلت شطيرة" هي جملة مقبولة باللغة العبرية، ولكن "دانا أكلت شطيرة" أو "دانا أكلت شطيرة"، ليست جمل مقبولة. وفي السنوات الأخيرة، بدأ العلماء في اختبار الشبكات العصبية الاصطناعية بطريقة مماثلة، ووجدوا لدهشتهم تشابها كبيرا بين الأحكام البشرية واحتمالية تخصيص الشبكات العصبية الاصطناعية لجمل مختلفة.
وفي الدراسة الحالية، أراد الباحثون اختبار حدود التشابه بين البشر والشبكات. ولهذا الغرض، قاموا بتطوير برنامج يبني أزواجًا من الجمل "المثيرة للجدل" بين الشبكات. في كل زوج من هذه الأزواج، توجد جملة تحددها إحدى الشبكات على أنها مقبولة، بينما تحددها الشبكة الأخرى على أنها غير مقبولة. يتم الحكم على الجملة الثانية من قبل الشبكات بالطريقة المعاكسة - حيث تحددها الشبكة الأولى على أنها غير مقبولة والشبكة الثانية على أنها مقبولة.
على سبيل المثال، تم العثور على جملة "هذا هو الأسبوع الذي كنت تموت فيه" غير مقبولة وفقًا لشبكة من النوع GPT-2، ومقبولة تمامًا وفقًا لشبكة من النوع BERT. من ناحية أخرى، تبين أن جملة "تلك هي الرواية التي بعناها" مقبولة وفقًا لـ GPT-2 وغير مقبولة وفقًا لـ BERT. بعد أن أنشأ الباحثون مئات الأزواج من هذه الجمل، تم تقديم الجمل إلى 100 شخص من البشر الناطقين باللغة الإنجليزية، الذين طُلب منهم الحكم على الجملة الأكثر قبولًا لكل زوج. في مثل هذا الاختبار، يجب أن تفشل إحدى الشبكات، لأنها لا تتفق مع بعضها البعض.
ووجد الباحثون أنه في ظل هذا الاختبار الصارم، تظهر جميع الشبكات اختلافات كبيرة في أحكامها مقارنة بالبشر. لقد قبلوا الجمل غير النحوية وغير المنطقية بأنها مقبولة، وفي نفس الوقت رفضوا الجمل النحوية والمنطقية باعتبارها غير مقبولة. الشبكة التي وُجد أنها الأكثر تشابهًا مع البشر هي GPT-2، والتي تتعلم من خلال محاولة التنبؤ بالكلمة التالية في النص، وهو نفس المبدأ المطبق في مرحلة التدريب الأولى والرئيسية لروبوتات الدردشة مثل ChatGPT.
يوضح الدكتور جولان: "يكشف البحث عن فجوات بين طريقة الشبكات العصبية الاصطناعية وطريقة معالجة البشر للغة المكتوبة". "مع تقدم مجال الذكاء الاصطناعي، أصبح من الأسهل على هذه الشبكات خداعنا والتظاهر بأنها مشابهة جدًا في سلوكها للبشر. ولكن عندما نقوم بتفعيل الأدوات المناسبة، يمكننا أن نرى أنه لا يزال هناك طريق لنقطعه حتى نصل إلى خوارزميات تحاكي السلوك البشري بدقة شديدة، ومن الممكن ويمكننا بناء شبكات عصبية تحاكي الأحكام اللغوية البشرية بدقة فقط عندما تدرك الشبكات مهارات معرفية إضافية، مثل استشعار البيئة ومراقبة حركة المرور، ولن يقتصر الأمر على قراءة ملايين الكتب".
وضمت مجموعة البحث: أستاذ كريستوفر بليدزنو وأستاذ نيكولاوس كريجسكورتا من قسم علم النفس بجامعة كولومبيا.
تم تمويل هذا البحث (رقم المنحة 1948004) من قبل مؤسسة العلوم الأمريكية وزمالة زوكرمان.
المزيد عن الموضوع على موقع العلوم: