نشرت إحدى المجلات الطبية الأكثر احتراما في العالم، مجلة نيو إنغلاند الطبية، مقالا يتضمن اقتراحا غير عادي: الموافقة على الذكاء الاصطناعي بطريقة مشابهة لعملية الموافقة التي يمر بها الأطباء البشريون. أو بمعنى آخر: منح الذكاء الاصطناعي رخصة لممارسة الطب بعد أن مر في أدائه على أداء الأطباء المتخصصين
قريباً، سيتمكن الذكاء الاصطناعي من ممارسة الطب على مستوى عالٍ. ولكن كيف نعرف إذا كانت آمنة أم لا؟ ماذا سيفعل المشرع ومن يجب أن يعهد بسلامتنا؟ نشرت إحدى المجلات الطبية الأكثر احتراما في العالم مقالا يتضمن اقتراحا غير عادي: الموافقة على الذكاء الاصطناعي بطريقة مشابهة لعملية الموافقة التي يمر بها الأطباء البشريون. أو بمعنى آخر: منح الذكاء الاصطناعي رخصة لممارسة الطب.
لنبدأ باكتشاف: الاعتقاد السائد في وادي السيليكون الآن هو أننا سنكون قادرين على الوصول إلى "الذكاء الاصطناعي العام" في غضون أربع سنوات تقريبًا. أي أننا سنطور ذكاءً اصطناعيًا قادرًا على فعل كل ما يستطيع البشر فعله تقريبًا. وحتى لو كان الناس في وادي السليكون متفائلين أكثر مما ينبغي ــ وهو أمر ممكن بكل تأكيد ــ فلا أحد يعتقد أن تقدم الذكاء الاصطناعي سوف يتوقف في السنوات المقبلة. العكس تماما. الإجماع العام هو أنه سيستمر في التطور والتحسن. قد لا تكون قادرة على القيام بكل شيء على المستوى البشري، ولكن بعض المهام، وبعض المهن، ستتم أتمتتها بسرعة أكبر من غيرها.
قد تكون مهنة الطب واحدة منهم.
إن العالم الغربي ـ وخاصة الولايات المتحدة ـ يشهد حالياً نقصاً هائلاً في عدد الأطباء. النقص سوف يتفاقم فقط. ووفقا لتقرير صادر عن رابطة كليات الطب الأمريكية، بحلول عام 2034 في الولايات المتحدة، سوف تحتاج البلاد إلى ما يقرب من 125,000 طبيب إضافي من العدد المتوقع أن يكون فيه.
لكن الحقيقة أكثر كآبة، لأننا نحتاج دائمًا إلى الأطباء. نحن لم نفهم ذلك بعد، لأننا اعتدنا على العيش في بيئة من الندرة. تعتبر الاستشارة الطبية سلعة باهظة الثمن للغاية، فهي تتطلب وقت واهتمام الشخص الذي درس لأكثر من عقدين من الزمن ليكتسب مهارته النادرة. يجلس هؤلاء الأشخاص في العيادات أو العيادات أو المستشفيات، ويقوم المرضى بالحج إليهم باستثمار كبير للوقت والمال.
في عالم يمكن أن يتولى فيه الذكاء الاصطناعي دور الطبيب، سيتمكن كل واحد منا من تلقي المشورة الطبية بسهولة وسرعة. لن نضطر إلى قضاء ساعات من وقتنا للوصول إلى عيادة الطبيب، ولكن يمكننا الحصول على نصيحته في المنزل. ولن نكتفي بطبيب واحد، بل سنتمكن من تلقي المشورة من لجان كاملة من الأطباء الخبراء -كلهم يعتمدون على السيليكون- الذين سيتناقشون معًا في العالم الافتراضي ويتوصلون إلى قرار بشأن حالتنا الطبية.
كل هذا جيد وجيد، ولكن هناك مشكلة واحدة كبيرة: المشرع لن يوافق على دخول الأطباء المعتمدين على السيليكون بهذه السهولة.
وهذا صحيح.
أخطر طبيب
كان جون شو ينقل كبار السن إلى المستشفى ويعود بهم في سيارته الأجرة الصغيرة في التسعينيات. وبمرور الوقت، لاحظ وجود نمط غير عادي: أكثر من عشرين شخصًا من كبار السن الذين وصلوا إلى المستشفى بصحة جيدة، ماتوا فجأة وبشكل غير متوقع في المستشفى نفسه. وبعد عدة حالات وفاة غير عادية، حدد العامل المشترك: دكتور هارولد شيبمان لقد كان الطبيب الذي يعالج الجميع.
أبلغ شو الشرطة بشكوكه في أغسطس 1998، وتم القبض على شيبمان بعد ذلك بوقت قصير. وبعد تحقيق ومحاكمة طويلة، قررت المحكمة أن شيبمان قتل ما لا يقل عن خمسة عشر مريضًا كانوا يثقون به، وقام بتزوير وصية أحدهم من أجل أن تترك له المشرف الخاص بك. تم تنفيذ جرائم القتل باستخدام جرعة زائدة من المخدرات لتجنب الشك. الاعتقاد السائد اليوم هو أن شيبمان طوال حياته المهنية الواسعة يكفي للقتل 250 مريضا.
سيكون الذكاء الاصطناعي قادرًا على قتل عدد أكبر بكثير.
كان العامل الرئيسي الذي حد من شيبمان هو الوقت. يستطيع الطبيب البشري علاج عدد محدود من المرضى يوميًا، لا يزيد عن بضع عشرات على الأكثر. ومع ذلك، يمكن لمحرك ذكاء اصطناعي واحد أن يقدم المشورة الطبية لملايين الأشخاص كل يوم، بل وحتى المليارات. وإذا ارتكب بعض الأخطاء مرارًا وتكرارًا، أو كان يعاني من "نقطة عمياء" فيما يتعلق ببعض الأمراض، فسيكون قادرًا على إيذاء العديد من الأشخاص في وقت قصير جدًا.
لا عجب إذن أن يرغب المشرعون في التأكد من أن الذكاء الاصطناعي في المستقبل ــ تلك القادرة على تقديم المشورة الطبية مباشرة للمرضى ــ سيكون آمنا للغاية.
ولكن كيف تفعلها؟
وفقا لديفيد بلومنثال، الطبيب في جامعة هارفارد، فإن الحل بسيط: يجب على المشرعين اختبار الذكاء الاصطناعي كما لو كانوا أطباء أنفسهم.
الأطباء أو الأدوات
نشر بلومنثال مقالًا في منتصف عام 2024 في إحدى المجلات الطبية الأكثر احترامًا في العالم: مجلة نيو إنجلاند الطبية. أو على الأقل في مشتق من هذه المجلة، والذي يركز بشكل خاص على الذكاء الاصطناعي. وجادل بلومنثال، جنبًا إلى جنب مع زميل له من جوجل، في مقال بأن القواعد التنظيمية المعمول بها حاليًا للذكاء الاصطناعي في الطب ليست كافية للتعامل مع الذكاء الاصطناعي الجديد. على وجه التحديد، محركات اللغات الكبيرة مثل ChatGPT، والتي يمكنها تقديم المشورة الطبية بمستوى مثير للإعجاب - حتى لو استمرت في ارتكاب الأخطاء، حتى لو كانت خطيرة.
اليوم، يركز المشرع في الولايات المتحدة بشكل أساسي على عدة أنواع من الذكاء الاصطناعي. أبسطها هي أنظمة "المساعدة في اتخاذ القرارات السريرية". وهي أنظمة محوسبة تقدم تحذيرات للطبيب حول الطريقة الضارة التي يمكن أن يؤثر بها عقاران على بعضهما البعض، أو توصي بقطر القسطرة الأنسب، وما إلى ذلك. يمكن للأنظمة "البسيطة" الأخرى أن توفر تقييمات إحصائية حول أسئلة محددة للغاية: على سبيل المثال، لتقدير فرص إصابة المريض بنوبة قلبية في ضوء مجموعة متنوعة من نقاط المعلومات حول صحته.
يتم تطوير هذه الأنظمة وبرمجتها من قبل البشر، والخوارزميات التي تقف وراءها بسيطة وواضحة. وبحسب مقال بلومنثال، فإن هذه الأنظمة لا تتطلب حتى موافقة المشرع، لأنها تعتمد بالكامل على الكتب الطبية - وتسمح للطبيب ببساطة بالعثور على التوصيات من الكتب ذات الصلة تلقائيًا.
يعتمد نوع أكثر تقدمًا من الذكاء الاصطناعي على "التعلم الآلي". في هذه الحالة، فإن الآلة نفسها هي التي تمر عبر مجموعة ضخمة من عناصر البيانات وتحدد الأنماط المتكررة. يمكن لمثل هذه الأنظمة تحليل الأشعة السينية، على سبيل المثال، أو التنبؤ بفرصة إصابة المريض بمرض السكري - ولكن ليس من الضروري أن يكون هناك تفسير واضح وراء استنتاجاتها. يوافق المشرع على الأنظمة القائمة على "التعلم الآلي"، لكنه يحصرها فقط في فئات تحليل محددة للغاية أثبتت نفسها فيها. على سبيل المثال، يمكن لبعض البرامج التي تم تدريبها على الأشعة السينية المأخوذة من رجال بيض أن تخطئ تمامًا عندما تواجه صورًا لنساء بيض.
وفي هذه الحالة، أقر المشرع الذكاء الاصطناعي المبني على "التعلم الآلي" مرة واحدة. ولكن بما أنه من الواضح أنه يمكن تحسينه عن طريق إضافة المزيد من المعلومات، فإن المشرع يسمح لمطوري الذكاء الاصطناعي بتحسينه من وقت لآخر، واختبار النظام المحسن، ومن ثم "قفله" لمزيد من التغييرات حتى المرة القادمة التي يقومون فيها بذلك. تريد تحسينه. إنها عملية طويلة ومعقدة، لكنها تسير بشكل جيد حتى الآن.
ثم جاءت محركات اللغة الكبيرة، وفجأة أصبح من الواضح للجميع أن القوانين القائمة ليست كافية.
المتدرب الذي خذلني
في أبريل 2024، نشر ثلاثة باحثين إسرائيليين - إيران كوهين، وأورييل كاتز، وإيدو وولف - دراسة أسفرت عن نتائج محرجة بشكل خاص للعديد من المتدربين. وقام الباحثون بتشغيل محرك اللغة الأكثر تقدما في ذلك الوقت - GPT-4 - على اختبارات الترخيص التي اجتازها متخصصون في طب الأطفال والجراحة العامة وأمراض النساء والطب النفسي والطب الباطني. تمت مقارنة إجابات المحرك بإجابات 849 متدربًا موازيًا.
وكانت النتيجة، كما ذكرنا، محرجة للمتدربين. كما أوضح الدكتور كوهين في مقابلة مع موقع واي نت -
"لقد أدركنا أن دردشة GPT-4 لم تتمكن من اجتياز الاختبار فحسب، بل حصلت في بعض الاختبارات على درجات أعلى من المتدربين."
وبينما تراوحت درجات المتدربين من 30 إلى 85، كان محرك الذكاء الاصطناعي ثابتًا ولم يفشل أبدًا. وفي الطب الباطني والطب النفسي على وجه الخصوص، تمكن من الحصول على درجة أعلى من معظم المتدربين الذين خضعوا للاختبار.
النقطة الأولى المثيرة للاهتمام حول الدراسة، بالنسبة لي، هي أن الباحثين لم يفحصوا محركات اللغة الرئيسية المختلفة. أي أن المحرك لم يتم تكييفه وتدريبه لكل من اختبارات التخصص المختلفة. والعكس تماماً: نفس المحرك وصل إلى هذه النتائج الباهرة في كافة مجالات التخصص. النقطة الثانية هي أنه عندما نظر الباحثون إلى "الأب" لـ GPT-4، وهو GPT3.5، رأوا أنه فشل في كثير من الأحيان في الاختبارات. كم من الوقت استغرق بين إصدار 3.5 في الأسواق وظهور GPT4؟ أقل من سنة.
هذه هي وتيرة الأحداث اليوم.
يقدر خبراء الصناعة أن زمن إنشاء محركات اللغات الرئيسية - أي مقدار الوقت اللازم لتحقيق تحسن كبير في هذه المحركات - هو ثمانية أشهر فقط. فالمشرع لا يعرف كيف يعمل ويفحص نجاحاته في مثل هذه الثوابت الزمنية. وحتى لو استطاع المشرع ذلك، فبماذا يختبرها؟ حول بعض القدرات الفرعية، مع القدرة على تقديم إجابات حول... كل شيء؟ بينما هي تتجاوز المتخصصين وتتركهم وراءهم كثيرًا - وقريبًا أيضًا الأطباء المتخصصين أنفسهم؟
هذه هي الطريقة التي توصل بها بلومنثال إلى حله: تقييم الذكاءات الاصطناعية الجديدة كما لو كانوا أطباء حقيقيين.
امتحانات الترخيص للذكاء الاصطناعي
في المقال الذي نشره، يقترح بلومنثال أن نتعامل مع الذكاء الاصطناعي الجديد ليس كأجهزة طبية، بل كأجهزة طبية
"نوع جديد من الذكاء السريري: أي تنظيمهم بشكل أقل كما لو كانوا أجهزة، وأكثر كما لو كانوا أطباء."
يشير بلومنثال بحق إلى أن لدينا الكثير من الخبرة في تقييم قدرات الأطباء في كليات الطب وفي تخصصات المستشفيات. يجب على الأطباء أن يتخرجوا من الجامعة، وأن يجتازوا اختبارات الترخيص، وأن يقوموا بفترة تدريب في هذا المجال، وأن يستمروا في التدريب واكتساب الخبرة والخبرة، وأن يوافقوا على فحص جودة رعايتهم من وقت لآخر.
ويقترح بلومنثال أن يوافق المشرع على المحركات اللغوية الكبيرة بعد اختبارها بعدة طرق، والتي تذكرنا بشكل مثير للريبة بمسار التدريب والفحص للأخصائيين الطبيين. إحدى الطرق، على سبيل المثال، ستشمل النجاح في الاختبارات التي ستعتمد على اختبارات الترخيص المهني. والطريقة الأخرى هي "فترة التخصص": وهي فترة زمنية يتم فيها تشغيل الذكاء الاصطناعي في الحالات السريرية وتقديم المشورة، ولكن سيكون كبار الأطباء الخبراء إلى جانبه لتصحيحه وتصحيحه إذا ارتكب خطأ. وفي كل مرة يخضع فيها الذكاء الاصطناعي للترقية، سيتعين عليه إعادة اجتياز الاختبارات النظرية وفترة التدريب.
وأخيرًا وليس آخرًا، والأهم، يقترح بلومنثال أن تكون نتائج جميع هذه الاختبارات والتخصصات متاحة للجمهور. وكما يعلق كل طبيب شهاداته على جدران العيادة، كذلك سيُظهر الذكاء الاصطناعي للمرضى أن "هناك شخصًا يمكن الوثوق به".
هذا إذن هو الحل الذي قدمه بلومنثال لمشكلة ترخيص الذكاء الاصطناعي في مجال الطب.
وأنا أكره أن أقول ذلك، لكن به ثقوب أيضًا.
المشاكل - والنجاح
لنبدأ بالجانب الإيجابي: يعجبني حل بلومنثال لأنه يتطلع إلى المستقبل. إن حقيقة أن إحدى المجلات الطبية الأكثر احتراما في مجال الطب تدرك بالفعل أن "ما كان ليس ما سيكون"، يوضح حجم التغيير. لقد بدأ صناع السياسات في مجال الطب في تجميع الأدلة معًا، وفهم أنهم بحاجة إلى الاستعداد لعالم مختلف تمامًا عن العالم الذي شهدناه حتى الآن.
ومعنى هذا التغيير الكبير أيضاً هو أن أي حل مقترح للتعامل معه سيكون بالضرورة سيئاً. هكذا تحدث الأمور دائما. ليس من الممكن على الإطلاق وضع سياسة مسبقة قادرة على فهم التعقيدات الكاملة للتكنولوجيا، قبل أن تؤتي ثمارها، ويبدأ الناس في اللعب بها. إن الحلول السياسية سوف تكون سيئة ـ بل وقد تبدو سخيفة وساذجة في نظرنا ـ في البداية. لكنهم سوف يتحسنون.
ومع ذلك، بوسعنا أن نبذل جهداً لإنتاج حلول سياسية أكثر ذكاءً منذ البداية.
المشكلة الرئيسية التي أراها في حل بلومنثال هي أن الذكاء الاصطناعي لا يمكن أن يكون "بجودة الطبيب البشري". ولا يمكنها أن تكون "أفضل من طبيب بشري" أيضًا. يجب أن تكون "أفضل بكثير". الكمال قد لا يكون ممكنا، ولكن يجب أن يكون ممتازا حقا.
لماذا؟ لأن عدد المراجع التي سيصل إليها سيكون ضخما. منذ اللحظة التي يمكننا فيها استشارة الذكاء الاصطناعي بسهولة الضغط على زر أو مكالمة فيديو، سنجري مناقشات معه كل يوم. والمهوسون بيننا سيفعلون ذلك كل ساعة. سنطلب نصيحتها بشأن مجموعة واسعة من المواضيع - وفي كل واحدة منها، هناك احتمال أن تفشل. وإذا فشلت، فإنها قد تفعل ذلك بطرق غير متوقعة، لأنها لا تتمتع بنفس عملية التفكير التي يتمتع بها الإنسان.
وهنا أيضًا المشكلة الثانية في حل بلومنثال: كيف يمكنك تنفيذ "فترة التخصص"، عندما تكون استخدامات الذكاء الاصطناعي مختلفة عن مجالات التخصص التي لدينا اليوم؟
المشكلة الثالثة تتعلق بالثوابت الزمنية. فهل من الممكن حقا اختبار الذكاء الاصطناعي في وقت قصير بما فيه الكفاية - على سبيل المثال، في ثمانية أشهر أو أقل؟ وإذا كان الأمر كذلك، فمن الذي سيختبره؟
لكنني أعترف أن هذه الأسئلة يمكن أن تكون مزعجة.
في النهاية يقدم بلومنثال حلًا ممكنًا، وهو أيضًا يدرك بالتأكيد أن هذه مجرد بداية لعملية تفكير حول المستقبل، وأنه من المستحيل الوصول إلى حل مثالي في البداية. ويعترف حله أيضًا لأول مرة بأن محركات اللغات الكبيرة تختلف تمامًا عن الذكاء الاصطناعي السابق بحيث تحتاج إلى معاملتها بشكل مختلف. في الواقع، طريقتنا الوحيدة لتقييم قدراتهم هي أن نطبق عليهم نفس المتطلبات الصارمة التي نضعها على الأطباء البشريين.
أعتقد أننا بحاجة إلى التفكير في حل مماثل في كل مجال: في المحاسبة والقانون وعلم النفس وكل شيء آخر. وليس من قبيل المبالغة الاعتقاد بأننا سنحتاج في غضون سنوات قليلة إلى أن نفهم في كل من هذه المجالات ما إذا كان الذكاء الاصطناعي قادرًا على القيام بعمل على مستوى يعادل أو أفضل من مستوى الخبراء البشريين. وبطبيعة الحال، اتخاذ قرار بشأن كيفية جعل هذه الذكاءات الاصطناعية في متناول الجمهور.
الرؤية المتفائلة للطب
سأختتم كلامي بالتفاؤل: إننا نتحرك نحو مستقبل الوفرة. يوضح مقال بلومنثال أنه في المستقبل، سيتمتع الذكاء الاصطناعي في مجال الطب بقدرات الأطباء البشريين - ومن المحتمل أن يتفوق عليهم عاجلاً أم آجلاً. سيكون المستقبل حيث يتمتع كل واحد منا بأسلوب الحياة الذي يتمتع به الأغنياء فقط اليوم: طبيب شخصي لكل شخص، في أي وقت. وليس طبيبًا واحدًا فقط، بل لجنة كاملة من الأطباء الخبراء. كل الوقت. سوف يعتنون بنا، ويكتشفون المشاكل الطبية قبل سنوات من اكتشافها بشكل طبيعي، وسيكونون قادرين على التأكد من أننا نتلقى العلاج الأكثر نجاحًا، في أقرب وقت ممكن.
وربما تكون الطريقة لمعرفة أنهم يعرفون حقًا ما يتحدثون عنه، هي تمامًا كما نفحص طلاب الطب لدينا اليوم.
لذا نتمنى النجاح لأطباء المستقبل المحوسبين - فهم سيساعدوننا جميعًا. على الأقل بمجرد حصولهم على ترخيصهم.
المزيد عن الموضوع على موقع العلوم: