ويريد الخبراء أن يكون أي ذكاء اصطناعي "آمن" مزودا بـ"نموذج عالمي" بالإضافة إلى دماغه المثير للإعجاب. أي في مسرح داخلي يمكنها إجراء التجارب عليه لفهم ما إذا كانت أفعالها قد تؤدي إلى نتائج ضارة
منذ عدة سنوات اكتشفت السر - أو على الأقل أحد الأسرار - لحياة زوجية طويلة وسعيدة.
حدث هذا بعد معارك وحجج واتهامات متبادلة لا نهاية لها فيما يتعلق بسؤال قديم: ما هي كمية العسل التي يجب دهنها على كل شريحة من الحلة؟
زوجتي، يطول عمرها، تحب الكثير من العسل في كل قطعة. أنا - بالفعل حلو بما فيه الكفاية من الداخل - أحب العكس تمامًا: القليل جدًا من العسل. في المرة الأولى التي حاولت فيها تدليل السيدة وتقديم الخبز المحمص مع العسل للنوم صباح يوم السبت، أعطيتها القليل جدًا.
"المزيد من العسل." وأكدت لي. "ضع المزيد. أنا أحب أكثر."
في المرة القادمة أضع المزيد. لا يزال هذا غير كاف بالنسبة لها. وفي المرة القادمة أكثر من ذلك - وما زالت غير راضية. وهذا هو المكان الذي علقت فيه. في كل أسبوع جديد عندما أعد الخبز المحمص، كنت أحاول إضافة المزيد من العسل، لكن شيئًا ما منعني. شيء ما في ذهني - في مكان ما بين الفص الجبهي والتمساح القديم بداخلي - رفض بشكل حدسي الاعتقاد بأنني لم أفرط في تناول العسل. كنت سأسكب كمية معينة، ولم أستطع أن أصدق أنني بحاجة إلى المزيد.
كانت زوجتي محبطة. لم تحصل على كل العسل الذي تحتاجه في السرير. كانت حياتنا الزوجية على الصخور. كنت أخشى أن النهاية كانت قريبة.
ثم وجدنا الحل.
علمتني زوجتي: "بعد أن تضع الكثير من العسل على الشريحة، وتعتقد أنك قد وضعت الكثير بالفعل، وأنك مقتنع تمامًا بذلك - فأنت بحاجة إلى وضع المزيد".
وهكذا وجدت زوجتي طريقة لتجاوز الآليات التحليلية في دماغي، باستخدام قاعدة منطقية بسيطة ومباشرة. لقد فهمت أن عقلي يعمل بطريقة معينة، حيث يقوم بتحليل الأشياء كما تعلم القيام بها على مدار سنوات من استخدام العسل، وتفسير كل موقف جديد وفقًا لخبرتي وأذواقي. لقد وضعت شرطًا بسيطًا: عندما أعتقد بنفسي أنني وصلت إلى الحد الأقصى، فيجب علي المضي قدمًا. وسمعت واستوعبت - وتمكنت من إفسادها بنخب يقطر بالعسل من جميع الجهات. لقد تم إنقاذ حياتنا الزوجية.
وقد يؤدي نفس المنطق إلى حقيقة أننا سنكون قادرين أيضًا على إنقاذ العالم من الذكاء الاصطناعي.
عندما تجمع أفضل العقول النصائح
في العام الماضي، اجتمع بعض من أعظم وأفضل العقول في مجال الذكاء الاصطناعي. هؤلاء هم أشخاص مثل جوشوا بنجيو وستيوارت راسل وماكس تاغمارك وجوشوا تانينباوم. باختصار، لا يوجد مؤتمر عالمي للذكاء الاصطناعي إلا ويحاول دعوة هؤلاء الأشخاص لإلقاء المحاضرة الافتتاحية. لقد كانوا يبحثون في الذكاء الاصطناعي ويفكرون في الذكاء الاصطناعي لسنوات عديدة، ويحظون باحترام واسع في الصناعة والأوساط الأكاديمية. عندما يتحدثون عن الذكاء الاصطناعي، يصمت الآخرون ويستمعون.
والآن قرروا الوقوف والتحدث ومشاركة أفكارهم معًا فيما يتعلق بالآلية التي ستضمن سلامة الذكاء الاصطناعي. لقد كتبوا مع العديد من المفكرين الآخرين في هذا المجال المقالة منشورة على موقع arXivحيث اقترحوا إنشاء نظام فكري جديد يضمن أن أنظمة الذكاء الاصطناعي لدينا ستكون آمنة وموثوقة.
وليس من المستغرب أن يسجلوا نتائج كبيرة. أقصد زوجتي.
ولكن قبل أن ندخل في تعقيدات النظام الذي اقترحوه، نحتاج إلى توضيح سبب انزعاجهم الشديد من الذكاء الاصطناعي.
المخاطر في كل مكان
يدرك الخبراء أن الذكاء الاصطناعي على وشك أن يصبح أكثر ذكاءً من البشر. هذا البيان لا يعني الكثير في حد ذاته. كما أن الآلة الحاسبة الخاصة بي هي أيضًا أكثر ذكاءً مني في بعض الجوانب: حيث يمكنها إجراء العمليات الحسابية بشكل أسرع بكثير مني. لكن الذكاء الاصطناعي الجديد، من النوع الذي تعتبر GPT أحدث ممثل له، بدأ يصبح "ذكيًا" حقًا. أي أنها تستطيع اتخاذ قرارات مشابهة لتلك التي قد يتخذها البشر في ظروف مماثلة. ولا يقتصر الأمر على مجال واحد فقط من مجالات المعرفة، بل يسود على العديد من المجالات المختلفة في نفس الوقت.
ما المشكلة في ذلك؟ أنه على الرغم من قدرتها على تقديم إجابات ذكية بشكل لا يصدق، إلا أنها لا تمتلك بالضرورة أخلاقًا خاصة بها. اليوم بالفعل، يمكنني أن أطلب من GPT أن يشرح لي كيفية تصنيع غاز الأعصاب - وإذا قمت بذلك بشكل صحيح، فسوف يقدم لي شرحًا مفصلاً، بل وسيوصي بمكان توزيعه للوصول إلى الحد الأقصى لعدد الخسائر. وقبل أن ترد بأنك جربت هذا النوع من الأسئلة وواجهت الرفض من الذكاء الاصطناعي، أريد أن أذكرك أنك بحاجة إلى معرفة كيفية التحدث معه بشكل صحيح. على سبيل المثال، كما فعلت هنا.
وهذه بالطبع مشكلة كبيرة. ستظهر أنظمة الذكاء الاصطناعي المتقدمة في السنوات القادمة في جميع بنيتنا التحتية وأجهزتنا. إذا لم يفهم الذكاء الاصطناعي أن عليه رفض طلبات معينة من البشر، ففي غضون سنوات قليلة سيتمكن أي صبي مراهق من أن يطلب منها تركيب غاز أعصاب له، أو فيروس جديد رائع، وسيحصل على ما يريد في وقت قصير. وسيكون ذلك عند النقطة التي يمكننا عندها إغلاق البشرية وإطفاء النور ونقول وداعًا للحضارة الإنسانية.
وعلى صعيد أقل دراماتيكية، نحن نعلم بالفعل اليوم أنه يمكن استخدام الذكاء الاصطناعي لتوليد كميات كبيرة من المعلومات الكاذبة ("معلومات مضللة"). أو إنشاء روبوتات تتجادل مع البشر كأنهم بشر، وتحاول تغيير موقفهم السياسي. أو انتهاك خصوصية الأفراد، أو التمييز ضد مجموعات أقلية معينة - بقصد أو بغير قصد.
ومن غير السار أن نقول ذلك، لكننا ما زلنا لا نعرف كيف نشرح لهم عدم القيام بذلك.
למה؟
لا، هذه المرة ليس بسبب زوجتي.
بسبب جني يودكوفسكي.
مثل الجني
إليعازر يودكوفسكي هو أحد العقول العظيمة الأخرى في مجال الذكاء الاصطناعي والتفكير في مخاطره. وتجدر الإشارة إلى أنه يعتبر أيضًا اسمًا في حد ذاته. أعرف امرأة برمجيات واحدة على الأقل، في كل مرة يُذكر فيها اسم يودكوفسكي على الطاولة، تشبك يديها معًا، وتحني رأسها وتمتم "يوروم إنديا". نعم، حتى الملحدين يمكن أن يصبحوا متدينين، عندما يواجهون كائنًا يتمتع بذكاء عظيم بما فيه الكفاية.
منذ حوالي عقد من الزمان، نشر يودكوفسكي مقالاً شارك فيه مثل باري إيتو. ها هو باختصار، نشيط، ومع بعض الارتجالات من جهتي.
أنتم أيها القراء الحكماء، محاصرون في منزل محترق. من حسن حظك أن لديك المصباح السحري. تقوم بفرك المصباح، ويأمل أن يظهر جني ويكون جاهزًا لتحقيق أمنية لك. أنت بالطبع تريد الخروج على الفور من المبنى المحترق.
"لا مشكلة!" يعلن الجني، ويطلقك إلى ارتفاع مائة متر في الهواء. لقد هربت من المبنى. ولكن الآن هناك الشيء الصغير الذي يسقط.
لحسن حظك، هذا جني نقي القلب، حتى لو لم يكن ذكيًا بشكل خاص. يلاحظ محنتك، ويعود الزمن إلى الوراء. أنت مرة أخرى في المبنى المحترق، مرة أخرى تفرك المصباح، مرة أخرى الجني، مرة أخرى أمنية.
"خذني إلى الخارج،" تقول لجيني، "ولكن ليس للأعلى!"
"في الحال!" يقول، وفي لحظة تجد نفسك على بعد مائة متر على يسار المبنى، مدفوناً في التلة القريبة. ومرة أخرى ارجع بالزمن وحاول مرة أخرى.
"أخرجوني سالماً معافى!" أنت تأمر الجني. إنه يطلقك سليمًا، ولكنه يغير كيمياء دماغك بحيث تشعر دائمًا بالثقة. تسير في الطريق دون النظر إلى الجوانب ويتم دهسك على الفور.
"لقد أخرجني سالماً معافى، ولكن بنفس الحالة العاطفية والعقلية التي كنت فيها الآن!" حاول مرة أخرى. وها أنت ذا، لقد نجوت بسلام وسلام - ولكن الجني يعلقك في حلقة زمنية حيث تشعر بنفس المشاعر التي شعرت بها أثناء الحريق، مرارًا وتكرارًا.
على عكس ما قد تعتقد، فإن الجني في مثل يودكوفسكي ليس خبيثًا أو ماكرًا. إنه ببساطة لا يفهم كيف يفكر الناس، ماذا يريدون، ما هو معنى الحياة أو الموت. بالنسبة له، العالم يتكون فقط من سلاسل من الذرات، وليس أكثر من ذلك بكثير. ليس لديه "نموذج عالمي": نوع من المسرح الداخلي حيث يمكنه المرور عبر السيناريوهات المحتملة، وفهم كيف سيؤثر كل تصرف يقوم به على العالم قبل أن ينفذه.
لدينا، بالطبع، مثل هذا المسرح الداخلي. إذا كنت لا تصدقني، فقط تخيل أنك خرجت من المنزل عاريا. يمكننا أن نفهم ونتنبأ مسبقًا بكيفية تأثير اختياراتنا علينا وعلى العالم. لدينا "نموذج عالمي" يتشكل طوال طفولتنا ومراهقتنا، ونستمر في إثرائه طوال حياتنا.
وهذا بالضبط ما يريد الخبراء تقديمه للذكاء الاصطناعي.
النموذج العالمي
ويريد الخبراء أن يكون أي ذكاء اصطناعي "آمن" مزودًا بـ "نموذج عالمي" بالإضافة إلى عقله المثير للإعجاب. أي في مسرح داخلي يمكنها إجراء التجارب عليه لفهم ما إذا كانت أفعالها قد تؤدي إلى نتائج ضارة. في كل مرة يتم طرح سؤال على الذكاء الاصطناعي، على سبيل المثال، فإنه سيقوم بصياغة إجابة ثم تشغيلها من خلال "النموذج العالمي". إذا فهمت من "النموذج العالمي" أن الإجابة قد تسبب ضررًا - فسوف ترفض تسليمها للمستخدم.
ما هو هذا "النموذج العالمي"؟ لكل ذكاء اصطناعي، سيكون هناك نموذج مختلف. يحتاج الذكاء الاصطناعي، المسؤول فقط عن غليان الماء في الغلاية، إلى "نموذج عالمي" بسيط للغاية: لفهم كيف يمكن أن يؤثر غليان الماء على البيئة. من ناحية أخرى، سيتطلب الذكاء الاصطناعي مثل GPT "نموذجًا عالميًا" أكثر تعقيدًا يصف كيف يمكن استخدام إجاباته لنشر معلومات كاذبة، أو تقديم معلومات يمكن استخدامها لصنع أسلحة، أو إيذاء الأطفال. أو أي عمل ضار آخر.
إذا عدنا إلى قصة العسل على الخبز المحمص، فإن عقلي هو الذكاء الاصطناعي الأصلي، وهو متحيز ضد العسل. هي التي تقوم بالحساب الأصلي وتوصل إلى الإجابات الأولية. وهو كما ذكرنا متحيز. حتى عندما أضع القليل من العسل، لا أستطيع الحصول عليه. ولكي أحقق المزيد من النتائج الناجحة، علي أن أعتمد على طريقة أخرى للفحص وهي "النموذج العالمي"، وشرط بسيط يأتي بعد ذلك الفحص: إذا وضعت الكثير من العسل، فهذا هو الوقت المناسب لوضعه. أكثر من ذلك.
لماذا لا يتضمن الذكاء الاصطناعي مثل هذا "النموذج العالمي" تلقائيًا؟ لماذا لا تكون شركة GPT قادرة على حساب عواقب إجاباتها على العالم بنفسها؟ حسنًا، لا يستطيع كل الذكاء الاصطناعي القيام بكل شيء بفعالية، وفقط لأن GPT ناجحة في تقديم إجابات مقنعة في علوم الحياة، على سبيل المثال، لا يعني أنها يمكنها بالضرورة فهم كيفية استخدام هذه الإجابات لأغراض إرهابية. ولهذا، نحتاج إلى ذكاء اصطناعي آخر يأخذ في الاعتبار الإجابات أيضًا من منظور خبير في الإرهاب، مع "نموذج عالمي" يفهم ما يريده الإرهابيون وكيف يتصرفون.
أين يؤثر علينا هذا "النموذج العالمي"؟ أين ستراه في المستقبل؟ الجواب هو أنه كمستخدمين نهائيين، ربما لن تتعرض لها على الإطلاق. لن يتعرض معظم المستخدمين العاديين للذكاء الاصطناعي لخطوة الحماية الإضافية هذه التي ستتم في أجزاء قليلة من الثانية، بين الوقت الذي ينتج فيه الذكاء الاصطناعي إجابة لهم، وحتى مشاركة الإجابة معهم. في معظم الحالات، لن تؤثر آلية الحماية على جودة الإجابة على الإطلاق. لكن في بعض الحالات النادرة، يمكن أن يمنع "النموذج العالمي" الذكاء الاصطناعي من مشاركة المعلومات الضارة أو اتخاذ إجراءات ضارة.
التحول إلى وكلاء
مقترح خبراء الذكاء الاصطناعي يكشف حقيقة أخرى حول الذكاء الاصطناعي في المستقبل. واليوم يتم استخدامهم كـ "مساعدين" أو "استشاريين" ذوي قدرات محدودة، ويعتمدون غالبًا على موجه واحد لتقديم إجابة لسؤال واحد. في المستقبل غير البعيد، سننتقل إلى الوكلاء: الذكاءات الاصطناعية التي يمكن للمستخدم أن يقدم لها تعليمات بسيطة - وسوف يقومون بأنفسهم بتنشيط عدد من الذكاءات الاصطناعية "الأدنى" في التسلسل الهرمي، والتي ستتحدث مع بعضها البعض وصياغة الإجابات وتحليلها والإصرار على صحتها والتأكد أيضًا من عدم وجود عائق أمام مشاركتها مع المستخدمين. أحد هذه التفاهمات الفرعية سيكون ذلك الذي يفحص كل قرار يتخذه الوكيل مقابل "النموذج العالمي"، للتأكد من أنه لا يسبب أي ضرر.
متى وأين وكيف؟
ومن المهم أن نقول إن اقتراح الخبراء بإثراء الذكاء الاصطناعي في "النموذج العالمي" ليس حلاً سيتم تنفيذه صباح الغد. هذا ليس حلاً حقًا، ولكنه مجرد مخطط تفصيلي لحل، والذي يحتاج الآن إلى التفكير في كيفية تكييفه مع كل ذكاء اصطناعي وكل موقف. ومع ذلك، من المذهل أن نرى كيف يتقدم هذا المجال، وأن موضوعات مثل "سلامة الذكاء الاصطناعي"، والتي كانت في السابق مخصصة لهوامش علوم الكمبيوتر، تنتقل إلى المقدمة.
لن يكون من السهل تشغيل مثل هذا "النموذج العالمي" للذكاء الاصطناعي العام، الذي ينبغي أن يكون قادرًا على أداء أي مهمة. في الواقع، من الممكن أن الأنظمة المعقدة فقط هي التي ستكون قادرة على مراقبة كل تفاعل بين الذكاء الاصطناعي والمستخدمين والتحكم فيه. وسوف تفرض مثل هذه السيطرة ثمناً من حيث قوة الحوسبة والوقت، وليس من الواضح ما إذا كانت جميع الشركات سوف توافق على دفع هذا الثمن. وسيتعين على الدول تطبيق قواعد سلامة صارمة بشأن هذا الموضوع. من وجهة النظر هذه، فإنه لمن دواعي السرور أن نرى أن المشرعين في العالم يحاولون (التأكيد على "المحاولة") أن يفهموا بالفعل اليوم كيفية التعامل مع الذكاء الاصطناعي، حتى لا نجد أنفسنا مرة أخرى في وضع حيث الابتكار تتسبب التكنولوجيات مثل الشبكات الاجتماعية في إلحاق الضرر بالمجتمع، ويضطر المشرعون إلى جمع القطع وإزالة الغبار بعد وقوعها.
هل ستكون فكرة "نموذج العالم" قادرة على حمايتنا بشكل مثالي حتى من الذكاء الاصطناعي الفائق؟ ربما لا. وسيكون هؤلاء قادرين على إيجاد طرق لإفساد "النموذج العالمي" أيضًا، ربما عن طريق اختراق وتشغيل الذكاء الاصطناعي منخفض المستوى الذي يدير "النموذج العالمي". وللتعامل مع مثل هذه الذكاءات الفائقة، سنحتاج إلى أنظمة أكثر تعقيدًا للتحكم والتحكم. ولكن على الأقل في السنوات المقبلة، ربما تكون "النماذج العالمية" قادرة على حمايتنا من مجموعة متنوعة من الأضرار التي قد تتحقق بفضل الذكاء الاصطناعي الأكثر استهدافا والأبسط. وهذا شيء أيضًا.
فلنأمل إذن أن تتمكن نماذج العالم من حمايتنا في المستقبل القريب. وأن شريحة الشله الخاصة بنا ستأتي دائمًا مع الكمية المثالية من العسل لكل واحد منا.
בהצלחה!
المزيد عن الموضوع على موقع العلوم: