هل يتوافق اختبار تورينج مع اختبار GPT؟

هل معيار تحديد هوية الإنسان والآلة الذي اقترحه تورينج قبل 75 عامًا مناسب في عصر برامج الدردشة المتقدمة؟

اختبار تورينج يتضمن روبوتين. تم إعداد الصورة بواسطة DALEE
اختبار تورينج يتضمن روبوتين. تم إعداد الصورة بواسطة DALEE

بدأت أجهزة الكمبيوتر المتطورة اليوم كآلات حاسبة: مجموعة من وحدات الحوسبة التي تعمل بالتنسيق مع بعضها البعض وفقًا لتعليمات محددة مسبقًا، وتؤدي حسابات معقدة بسرعة وكفاءة. في منتصف القرن التاسع عشر، عالم الرياضيات آدا لوفليس (لوفليس)، الذي يعتبر أول مبرمج، ترجمت وكتبت القوائم حول التصميم الأولي لـ "المحرك التحليلي"، وهو نوع من الكمبيوتر الميكانيكي. وزعم لوفليس أن قدرات مثل هذه الآلة الحاسبة سوف تقتصر على ما نعرفه عن كيفية توجيهها لإنتاجه، وأنها لن تكون قادرة على اختراع الأشياء بنفسها. ولم يكتمل تنفيذ المحرك التحليلي، ويرجع ذلك جزئيا إلى التكنولوجيا المحدودة في ذلك الوقت وصعوبات التمويل. 

أجهزة الكمبيوتر المبكرة لقد ولدوا في الواقع خلال الحرب العالمية الثانية. فتحت التكنولوجيا الحديثة طرقًا للتعامل مع مشاكل جديدة لم يكن لها حتى ذلك الحين حل عملي بسبب كمية الحسابات التي تتطلبها. وقد قدر الباحثون والمفكرون بعد ذلك أن حدود قدرات هذه الآلات تعتمد على كمية الذاكرة أو وحدات الحساب التي تمتلكها، وحاولوا فهم الإمكانات الكامنة في هذا الابتكار. أثارت الآلات التي حلت محل البشر في العمليات الحسابية المعقدة تساؤلات حول أوجه التشابه بين عملها والفكر البشري. 

في عام 1950، قدر عالم الرياضيات والمهندس كلود شانون (شانون) التعقيد الحسابي للعبة الشطرنج ووصف كيف يمكن للكمبيوتر تشغيل ملف PDF في لعبة يُنظر إليها على أنها تحدي ذهني معقد. وفي نفس العام، نشر عالم الرياضيات وعالم الكمبيوتر آلان تورينج (تورينج)، الذي كان أحد مؤسسي الذكاء الاصطناعي، كتب مقالاً أساسياً بعنوان "الآلات الحاسوبية والذكاء"وكتب فيه: "أعتقد أنه بحلول نهاية القرن سوف يتغير استخدام المفاهيم والرأي السائد إلى الحد الذي يمكننا فيه التحدث عن الآلات المفكرة دون توقع أي مقاومة". لقد أخطأ تورينج قليلاً عندما تنبأ بأننا سنرى الذكاء الاصطناعي في وقت مبكر من عام 2000. واليوم، وعلى الرغم من التطورات الهائلة التي حدثت في السنوات الأخيرة في أداء الذكاء الاصطناعي، فإننا لم نتوصل بعد إلى فهم العلاقة بين مفهومي "الآلة" و"التفكير".

يعتبر جهاز ENIAC، الذي تم بناؤه في عام 1946، أول جهاز كمبيوتر رقمي للأغراض العامة في العالم. فتح ظهور أجهزة الكمبيوتر الباب أمام إجراء حسابات معقدة لم يكن من الممكن الوصول إليها في السابق | الجيش الأمريكي، مكتبة الصور العلمية

أفكار حول التفكير

منذ قرون عديدة، اعتبر البشر التفكير بمثابة القدرة التي تميز جنسنا البشري عن غيره من الحيوانات. في عمله "مقال عن المنهج" عام 1637، اعتقد الفيلسوف والرياضي الفرنسي ديكارت رينيه (ديكارت) أنه على الرغم من أن الحيوانات تشبهنا في بنيتها، إلا أنه "لا يمكن العثور فيها على أي من الأنشطة المعتمدة على الفكر، والتي تنتمي إلينا وحدنا كبشر" (دار نشر كارمل، 2008. ترجمة: إيران دورفمان). ومن ناحية أخرى، ادعى أن الحيوانات يمكن تقليدها بطريقة لا يمكن تمييزها عن طريق الآلات ذات الأطراف الاصطناعية والتصميم الخارجي. وبحسب ديكارت، فإن هذه الكائنات الميكانيكية، مثل الحيوانات، تختلف عن البشر في قدرتها على التفكير.

يعتبر جهاز ENIAC، الذي تم بناؤه في عام 1946، أول جهاز كمبيوتر رقمي للأغراض العامة في العالم. فتح ظهور أجهزة الكمبيوتر الباب أمام إجراء حسابات معقدة لم يكن من الممكن الوصول إليها في السابق | الجيش الأمريكي، مكتبة الصور العلمية
يعتبر جهاز ENIAC، الذي تم بناؤه في عام 1946، أول جهاز كمبيوتر رقمي للأغراض العامة في العالم. فتح ظهور أجهزة الكمبيوتر الباب أمام إجراء حسابات معقدة لم يكن من الممكن الوصول إليها في السابق | الجيش الأمريكي، مكتبة الصور العلمية

وفي خمسينيات القرن العشرين، بدأ استخدام الأنظمة الاصطناعية أيضًا في الاتجاه المعاكس ــ كوسيلة للتحقيق في آليات التفكير. سعى عالم الأعصاب جراي والتر إلى دراسة السلوكيات المعقدة التي يمكن إنشاؤها من خلال شبكة من الاتصالات البسيطة. لقد طور السلاحف الاصطناعية، والتي كانت عبارة عن نوع من الروبوتات التي تشبه صدفة السلحفاة في شكلها، وكانت تتحرك وتتنقل في الفضاء بمساعدة أجهزة استشعار الضوء واللمس. وقد أتاحت لهم قدرات الاستشعار هذه تجاوز الأشياء التي تعيق طريقهم والوصول إلى محطة شحن كهربائية حسب الحاجة، على غرار روبوتات المكانس الكهربائية اليوم.

في المقال الذي قدم فيه والتر ملف PDF الخاص بالسلاحف ووصف سلوك الروبوتات الخاصة به عندما يكونون أمام المرآة كسلوك إذا عبّر عنه الحيوان فإننا ننسبه إلى الوعي الذاتي. ورغم أن صياغته كانت حذرة، إلا أنه كان من الممكن حتى أن نستشعر فيه ميلاً إلى مقارنة الآلات بالحيوانات أو البشر.

سلاحف جراي والتر. بناء أنظمة اصطناعية تحاكي التفكير للتعرف على آليات التفكير

شانون، عالم الرياضيات الذي كان مهتمًا، من بين أمور أخرى، بأجهزة الكمبيوتر التي تلعب الشطرنج، قام بتطوير الروبوتات التي تشبه الفأر من حل ألغاز المتاهة؟ ابتكر الطبيب النفسي روس آشبي في كتابه "تصميم الدماغ" نظامًا يمكنه التكيف مع البيئة من خلال العمل وتلقي ردود الفعل. عندما وصف والتر آلة آشبي في مقالته، ادعى أنه على الرغم من أنها آلة من صنع الإنسان، فمن المستحيل أن نعرف في أي لحظة معينة ما هي حالتها بالضبط دون "قتلها" وتحليل ما أسماه "نظامها العصبي". يميل البشر بطبيعتهم إلى إضفاء الصفة الإنسانية، أي إسناد الصفات الإنسانية إلى المخلوقات غير البشرية: سواء كانت حيوانات أو جمادات وآلات. ومن ثم فإننا نميل أيضًا إلى أن ننسب الذكاء إليهم. 

هل تحتاج إلى التفكير لحل الألغاز؟ روبوت يشبه الفأر داخل لغز المتاهة، تم تطويره بواسطة كلود شانون | ويكيميديا، متحف معهد ماساتشوستس للتكنولوجيا (MIT)
هل تحتاج إلى التفكير لحل الألغاز؟ روبوت يشبه الفأر داخل لغز المتاهة، تم تطويره بواسطة كلود شانون | ويكيميديا، متحف معهد ماساتشوستس للتكنولوجيا (MIT)

الامتحان الشفوي

على الحد الفاصل بين الروبوتات التي تحاكي الأفعال التي تتطلب التفكير وأجهزة الكمبيوتر التي تتطور قدراتها الحسابية بوتيرة سريعة، افتتح تورينج بحثه عن الآلات الحاسوبية والذكاء بالسؤال الاستفزازي "هل تستطيع الآلات التفكير؟" في ورقة بحثية نُشرت عام 1949، اقترح عالم الأعصاب البريطاني جيفري جيفيرسون الانتظار حتى يعترف الكمبيوتر بقدرته على التفكير حتى يتمكن من ذلك. كتابة السوناتات مثل شكسبير ملف PDFوقد لاحظ لوفليس من قبله أيضًا أن الكمبيوتر لن يكون مبدعًا. لكن تورينج اقترح تغيير النهج وطرح السؤال التالي: هل يمكننا التمييز بين الكمبيوتر والكيان المفكر؟

ولحل هذه المشكلة، اقترح اختبارًا أطلق عليه اسم "لعبة التقليد"، والذي يُعرف الآن باسم "اختبار تورينج". هيكل الاختبار بسيط: يتحدث الفاحص إلى شخصين للاختبار، أحدهما إنسان والآخر آلة، دون أن يعرف من هو من. يمكن للممتحن أن يطرح على كليهما سلسلة من الأسئلة حسب اختياره. يمكنه، على سبيل المثال، أن يطلب: "اكتب لي سوناتا". الإجابة المحتملة: "لا أعرف كيف. لم أتفق قط مع الشعر" ستكون إجابة معقولة لكلٍّ من الإنسان والآلة التي تتقمص شخصية الإنسان. في نهاية سلسلة الأسئلة، يُطلب من الفاحص أن يقرر من بين الممتحنين من هو الإنسان ومن هو الآلة. إذا تمكنت الآلة من خداع الفاحص وإقناعه بأنها الإنسان، فإنها ستجتاز الاختبار. سيتم إجراء جميع الاتصالات في الاختبار عن طريق الكتابة، حيث لا توجد في هذه الواجهة فجوة كبيرة في القدرات بين البشر والآلات، مقارنة بالكتابة اليدوية.

وقد أوضح الاختبار أنه من وجهة نظر تورينج، فإن البنية الداخلية للنظام الذي نود أن نعزو إليه القدرة على التفكير ليس لها أي أهمية - الشيء الوحيد الذي يهم هو نتيجة الاختبار. ومن هذا المنظور، فإن تعريفات التفكير ليست ذات أهمية، لأنها سوف تتغير بالتأكيد في المستقبل عندما نتعلم المزيد عن الموضوع. يكفي أن نركز على قدرتنا على التمييز بين المخلوق الذي نتفق على أنه يمتلك القدرة على التفكير، والمخلوق الذي لسنا متأكدين من أنه يمتلك هذه القدرة. يؤكد البروفيسور إيهود لام، الفيلسوف ومؤرخ علم الأحياء، في محادثة مع موقع معهد ديفيدسون الإلكتروني، أن "فكرة أن المحاكاة والشيء نفسه هما شيء واحد هو الإرث العظيم لألعاب المحاكاة".

تعتمد آلية التشخيص التي اقترحها تورينج على المحادثة باللغة الطبيعية. وقد ذكر ديكارت أيضًا اختبارًا مشابهًا. "لن تتمكن الآلات أبدًا من استخدام الكلمات أو العلامات الأخرى وربطها معًا كما نفعل للتواصل بأفكارنا مع الآخرين"، كما كتب في مقاله. بل إنه أوضح أنه من المعقول أن تعرف الآلة كيفية الاستجابة للمدخلات الموجهة مثل اللمس وتحذيرنا إذا أذيناها، ولكنها "لن تكون قادرة على ربط الكلمات بطرق مختلفة من أجل الاستجابة منطقيا لكل ما يقال في حضورها".

لقد أصبح اختبار تورينج مرادفًا لاختبار القدرة على التعبير عن الفكر، ولكن اعتماده على اللغة قد يثبت أنه نقطة ضعف رئيسية.

فيلم "ألعاب الحرب"، 1983. حتى في الثقافة الشعبية، تثير المحادثة مع الكمبيوتر تساؤلات حول الذكاء.

الوقوع في فخ

دعونا ننتقل للأمام إلى اليمين. لقد كان Chat-GPT هو محادثنا الدائم لمدة عامين ونصف تقريبًا. نطرح عليه أسئلة معرفية باللغة الطبيعية بدلاً من التركيز على صياغة الاستفسارات. لمحركات البحث، التفت إليه طلبا للمساعدة الأسئلة المهنية ونستخدمه أيضًا عندما نحتاج إليه. للحصول على المشورة الطبية أو لالدعم العقلي - بالرغم من لست متأكدًا من أن هذه فكرة جيدة.. نحن نفضل الروبوتات على عمليات البحث في Google بفضل الإجابات التفصيلية التي تقدمها لنا، والقدرة على مواصلة البحث بأسئلة متابعة تتكشف مثل المحادثة. تتاح للروبوتات الفرصة للإجابة على الأسئلة التي تتطلب عادةً إجابة مهنية موثوقة للغاية، وذلك بفضل الإجابات التي يتم صياغتها بطريقة متعاطفة، ولغة خدمة يمكن الوصول إليها، والكثير من الصبر.

وليس من قبيل المصادفة أن يكون الشعور بالمحادثة الطبيعية، والتي من المفترض أن تكون بمثابة اختبار، جذابًا لنا بشكل خاص. وقد لوحظ هذا الاتجاه في الأيام الأولى للمحادثات مع الآلات، حتى عندما كانت اصطناعيتها واضحة تماما. في عام 1966، تم تطوير برنامج ELIZA التفاعلي في معهد ماساتشوستس للتكنولوجيا (MIT). تم تصميم البرنامج بقدرة أساسية على التعرف على الأنماط في المدخلات، بحيث تؤدي بعض الكلمات التي يكتبها المستخدم إلى إجابة معدة مسبقًا، من مجموعة من الإجابات التي تحاكي التعاطف والفهم. لإدخال عبارة مثل "أنا مكتئب اليوم"، سيستجيب البرنامج "هل يمكنك أن تشرح لماذا أنت مكتئب اليوم؟" أو "أنا آسف لسماع أنك مكتئب". 

وقد شجع هذا التعاطف المستخدمين على تكريس أنفسهم للمحادثة وحتى إعطائها معلومات شخصية لن يشاركوها مع الجميع، على الرغم من أنه كان من الواضح أن رد الفعل على الشاشة لم يكن نتيجة لمشاعر حقيقية. وقال جوزيف وايزنباوم، مبتكر برنامج إليزا، إن سكرتيرته انخرطت في محادثة مع البرنامج وطلبت منه مغادرة الغرفة حتى يتمكن الاثنان من التحدث على انفراد.

تُعرف الظاهرة باسم "تأثير ELISA" بأنها ميل الأشخاص إلى التعرف على علامات الفهم العاطفي داخل سلاسل الكلمات التي يولدها الكمبيوتر. في التجارب الخاضعة للرقابة في دراسة تحدث فيها البشر إلى روبوتات مكتوبة تستخدم في التدريس والتعليم، وجد أنه عندما أصدر مثل هذا الروبوت استجابات تبدو وكأنها تعبر عن إدراكه لمشاعر محاوره، كان المشاركون يميلون إلى استنتاج أن الروبوت يدرك مشاعرهم حقًا وقادر على التأثير عليهم، مقارنة بالبرامج النصية التي تم فيها برمجة الروبوت للرد بجمل لا تعبر عن إدراك المشاعر البشرية. ويجب أن نتذكر أيضًا أن ميل البشر إلى إضفاء الصفة الإنسانية على الأشياء والحيوانات الأخرى يؤدي أيضًا إلى نسب المشاعر أو التعاطف إلى هذه الكيانات، وأن التواصل الصوتي أو المكتوب يضعف الحكم بشكل أكبر. هناك من يخدمهم هذا التشويش.

تم تصميم برنامج ELIZA لإخراج استجابة تعتمد على الكلمات الرئيسية المدخلة من قاعدة بيانات الاستجابة المعدة مسبقًا.

المصلحة الاقتصادية

OpenAI وGoogle وMicrosoft والشركات الأخرى التي تنتج روبوتات مثل تلك التي تحدثنا معها لمدة عامين ونصف هي شركات قائم على الربح. بعد شهرين فقط من إطلاق Chat-GPT، تم تقديمه بالفعل نسخة مدفوعة أكثر تقدمًاومنذ ذلك الحين، انتقلت الشركة إلى نموذج عمل قائم على الاشتراك الشهري، حيث تكون الإصدارات البسيطة والعيوب متاحة مجانًا لأي شخص يريدها، في حين تكون الإصدارات الجديدة والمحسنة محمية خلف جدار الدفع. تتمتع هذه الشركات بمصلحة اقتصادية وتنافسية في إنتاج روبوتات من شأنها أن تغري المستخدمين بالبقاء ومواصلة الدفع.

إذا كان هذا الروبوت يحتاج إلى نطق جمل أكثر متعة والرد باستجابات شاملة ومجاملة لتحقيق ذلك، فهذا هو ما سنعمل على التلاعب به للقيام به. تعتمد هذه الروبوتات على نماذج اللغة الطبيعية التي يتم تدريبها على كميات هائلة من النصوص. في الممارسة العملية، عندما يتم تلقي إدخال - أي جملة - من المستخدم، يقوم النموذج بتسلسل الإجابة كلمة بكلمة وفقًا للاستمرارية المحتملة وفقًا للتقديرات الإحصائية. في بعض الأحيان تنتج هذه النماذج مخرجات غير متسقة وغير منطقية تعرف باسم "الهلوسة"، ويبدو أن المطورون يتنازلون عن دقة الإجابات لتوفير استجابة حاسمة. فكر بنفسك في المحادثة التي تشعر براحة أكبر عند إجرائها - مع روبوت متردد وغير آمن أو مع روبوت حاسم. يقوم مطورو هذه الروبوتات بتكييف طبيعة المخرجات لتحسين تجربة المستخدم والحفاظ على ولائهم وثباتهم ودفعهم. ويشير لام إلى أن "الخطاب الذي يستخدم مفاهيم الذكاء يخدم مصالح شركات التكنولوجيا الفائقة".

لم يكن بوسع تورينج أن يتنبأ بسعة الذاكرة والقوة الحسابية التي ستسمح لمثل هذه النماذج بمسح أجزاء كبيرة من النصوص المتاحة على الإنترنت - ولا كان بوسعه أن يتنبأ بذلك. وبحسب التقديرات، فإن تدريب مثل هذا النموذج اللغوي يتم على منصة تحتوي على مليارات أو حتى تريليونات الكلمات. النصوص المستخدمة للتدريب تأتي من جميع أنحاء الويب، أي من كتاب مختلفين، ومن ثقافات مختلفة، ومن مجموعة متنوعة من الفترات التاريخية. وبناءً على هذه المجموعات، يتعلمون إحصائيات حول مجموعات الكلمات المحتملة.

يشير لام إن المجموعة الانتقائية التي تتعلم عنها النماذج تؤدي إلى "مفارقة المعضلة الخطابية". عندما تتكون المجموعة التي يعتمد عليها النموذج من مصادر مختلفة ومتنوعة، فلا توجد وسيلة إحصائية تسمح باستخلاص نتيجة موحدة ومتسقة منها. كل متحدث يساهم بنص في مثل هذه القاعدة البيانات لديه رؤيته الخاصة للعالم وأفكاره، ومن المستحيل استخلاص استنتاجات من كل منهم معًا دون الوقوع في تناقضات. ومن شأن مثل هذا النظام، بحكم بنيته، أن يشكل محاوراً مربكاً إلى حد ما.

يمكنك العثور على الألعاب عبر الإنترنت. والتي من المفترض أنها تسمح لك بتشغيل اختبار تورينج. تتيح لك هذه المواقع إجراء محادثة دردشة مجهولة وفي النهاية محاولة تحديد ما إذا كانت مع مستخدم آخر قام بتسجيل الدخول إلى الموقع للعب أو مع روبوت دردشة اصطناعي. يمكن أيضًا استخدام مثل هذه الملاحظات لجمع المعلومات التي ستساعد الشركات على قياس مستوى الثقة في روبوتاتها، وفهم كيفية حاجتها إلى التلاعب بها لطمس التصنع الملحوظ في المحادثة المكتوبة بينها وبين البشر من لحم ودم.

يقوم Chat-GPT في بعض الأحيان بإصدار إجابتين محتملتين لنفس السؤال ويطلب من المستخدمين تقييم الإجابة الأكثر إفادة لهم. وهكذا، فإننا نشارك أيضًا بشكل نشط في إمالة الناتج اللفظي، شيئًا فشيئًا، نحو منطقة الراحة الخاصة بنا، ومنطقة الراحة الخاصة بنا هي منطقة إنسانية.

من خلال تجربتي الشخصية، أستطيع أن أقول أنه عندما أستخدم مثل هذه المحادثات، أستطيع التعبير عن نفسي بأدب وبالآداب النموذجية للمحادثة مع البشر، أو العكس - أعبر عن نفسي بفارغ الصبر عندما لا أحصل على ما أريد. إن المحادثة نفسها تثير فينا الميل إلى التعبير عن أنفسنا كما لو كنا نواجه كائناً مفكراً وفاهماً. باعتبارنا بشرًا، فإننا نميل إلى الانجذاب إلى ما نعتبره كائنًا ذكيًا. هذا لا يعني أنه ذكي حقًا، لكن الميل إلى إدراكه على هذا النحو يضعف حكمنا.

يسأل Chat-GPT بشكل عرضي عن الإجابة التي يفضلها المستخدم. ستساعد الملاحظات النسخة المحسنة من الروبوت على توفير الإجابات المصنفة على أنها مفضلة، في عملية تسمى التعلم التعزيزي والملاحظات | لقطة شاشة لمحادثة الدردشة
يسأل Chat-GPT بشكل عرضي عن الإجابة التي يفضلها المستخدم. ستساعد الملاحظات النسخة المحسنة من الروبوت على توفير الإجابات المصنفة على أنها مفضلة، في عملية تسمى التعلم التعزيزي والملاحظات | لقطة شاشة لمحادثة الدردشة

ادخل إلى رأس الآلة

إن نماذج الشبكات العصبية التي تعتمد عليها المحادثات التفاعلية ضخمة ومعقدة. صعب، وأحيانا مستحيل اشرح لماذا تفضل الشبكة إصدار مخرج واحد بدلاً من آخر. حتى علماء الكمبيوتر ومطوري هذه الأنظمة لا يعرفون كيفية شرح ما تعالجها الشبكة بالضبط وما إذا كانت تمثل البيانات بطريقة مماثلة للمفاهيم التي نستخدمها نحن البشر. إن التوازي بين الشبكات العصبية الاصطناعية والدماغ ما زال بعيدًا عن الاكتمال، ولكن هناك تداخل كبير بين مناهج البحث، ومن الممكن أن تساعدنا دراسة نظام واحد في فهم النظام الآخر بشكل أفضل.

لا يزال اختبار تورينج يحظى بشعبية كبيرة حتى يومنا هذا، ويرجع ذلك جزئيًا إلى أنه يستخدم طريقة تشخيصية تبدو ملائمة لنا - اللغة المكتوبة. إن هذه الراحة، كما ذكرنا، تضر بموضوعيتنا. هناك العديد من الأسئلة الأخرى التي يمكن طرحها حول الذكاء وقدرات التقنيات الجديدة، التي تستمر في التقدم بوتيرة مذهلة. ويقول لام: "نحن نركز كثيرًا على الواجهة والتمثيل اللغوي". إن الاختبار الذي تم اقتراحه قبل 75 عامًا يعد نقطة بداية جيدة لمناقشة مهمة، ولكن كما أشار تورينج نفسه، فإن الأمور تتغير باستمرار. ويستحق الاختبار أيضًا المراجعة.

المزيد عن الموضوع على موقع العلوم:

تعليقات 2

ترك الرد

لن يتم نشر البريد الإلكتروني. الحقول الإلزامية مشار إليها *

يستخدم هذا الموقع Akismet لتصفية التعليقات غير المرغوب فيها. مزيد من التفاصيل حول كيفية معالجة المعلومات الواردة في ردك.