اكتشف الباحثون في معهد التخنيون أنه على عكس نماذج اللغة الاصطناعية التي تحلل النصوص الطويلة كقطعة واحدة، يقوم الدماغ البشري بتلخيص ما قرأه أثناء القراءة في نوع من "الملخص" الذي يسمح له بفهم بقية النص.

لقد أحدثت نماذج اللغة الكبيرة، بما في ذلك بعض "النجوم" الشهيرة مثل GPT وBard Chat، ثورة في قدرة أنظمة الكمبيوتر على أداء المهام وحل المشكلات على مدى العقد الماضي. تعتمد هذه النماذج إلى حد كبير على الشبكات العصبية الاصطناعية والتعلم أو التدريب على كميات كبيرة جدًا من النصوص. واليوم يقومون بالفعل بإنتاج النصوص، وترجمة النصوص من لغة إلى أخرى، وحتى تحديد المشاعر في نص معين.
وكما هو الحال مع الشبكات العصبية الاصطناعية، التي تشكل أساس الذكاء الاصطناعي بشكل عام، فإن برامج الماجستير في القانون تستلهم أفكارها أيضًا من الدماغ البشري، ولكن من المهم إدراك الاختلافات بين هذين العالمين. دراسة أجريت في معهد التكنيون ونشرت في طبيعة الاتصالات يشير إلى أوجه التشابه والاختلاف بين الدماغ ونماذج اللغة الكبيرة في سياق محدد: فهم النصوص المنطوقة.
تم قيادة البحث البروفيسور روي رايخرت والدكتور رافائيل تيكوتشينسكي من كلية علوم البيانات والقرار. هذا جزء من أطروحة الدكتوراه للدكتور تيكوتشينسكي، والتي أجريت تحت الإشراف المشترك للبروفيسور رايخرت من معهد التخنيون والبروفيسور أوري حسون من جامعة برينستون. الشركاء في البحث هم الدكتور أرييل جولدشتاين من الجامعة العبرية ويواف ميري، طالب ماجستير في كلية علوم البيانات واتخاذ القرار.
وتعتمد الدراسة التي أجريت في معهد تيشنيون على مسح التصوير بالرنين المغناطيسي الوظيفي - التصوير الوظيفي للدماغ - لـ 219 شخصًا أثناء استماعهم إلى القصص. قام الباحثون بفحص قدرة برامج ماجستير اللغة الموجودة على التنبؤ بنشاط الدماغ أثناء الاستماع، واكتشفوا أن التنبؤ ناجح فقط عندما يتعلق الأمر بنصوص قصيرة - عشرات الكلمات على الأكثر. وعندما يكون النص أطول، تفشل هذه النماذج في التنبؤ بالنشاط في دماغ المستمع.
وأظهر تيكوتشينسكي والبروفيسور رايخرت أن سبب هذا الفشل هو أن الدماغ البشري في النصوص الطويلة لا يتصرف على نحو مماثل للنصوص الطويلة. التشابه بين الاثنين موجود في النصوص القصيرة، حيث يقوم كل من الدماغ والنموذج بمعالجة جميع الكلمات الموجودة في المدخلات بالتوازي، أي في وقت واحد؛ عندما يكون النص طويلاً، يستمر النموذج الاصطناعي في معالجته بنفس الطريقة، لكن الدماغ - الذي لا يستطيع "هضمه" بالكامل - ينتقل إلى وضع آخر، وهو "آلية التجميع". وهذا يعني أن الدماغ يخزن النص الذي سمعه حتى الآن في نوع من "المخزن" للمعرفة السياقية، وعلى هذا الأساس، فإنه يفسر الكلمات التالية التي يسمعها.
أما النموذج الاصطناعي فيمكنه أن "يهضم" كل النص الذي سمعه حتى الآن مرة واحدة، وبالتالي فهو لا يحتاج إلى نفس الآلية التراكمية. وافترض الباحثون أن هذا الاختلاف الجوهري هو السبب وراء فشل النماذج الاصطناعية في التنبؤ بنشاط الدماغ عند الاستماع إلى القصص، بل وأثبتوا ذلك أيضًا؛ لقد قاموا بتطوير نموذج اصطناعي محسن يعمل بشكل مشابه للدماغ. تم بناء هذا النموذج على أساس الملخصات ديناميكية النص الذي سمع حتى الآن، والتي على أساسها فك شفرة بقية النص. لقد نجح هذا النموذج بالفعل في تحسين التنبؤ بنشاط الدماغ، حيث أظهر أن الدماغ المستمع منخرط باستمرار في تلخيص النص السابق والبناء عليه لفهم بقية النص. هذه الطريقة تسمح لنا باستيعاب كمية كبيرة من المعلومات التي نتلقاها على مدى فترة طويلة من الزمن، كما هو الحال، على سبيل المثال، في محاضرة كاملة، أو كتاب كامل، أو بودكاست كامل.
وباستخدام التحليل التكميلي، قام الباحثون برسم خرائط مناطق الدماغ التي تلعب أدوارًا حاسمة في عمليات المعالجة قصيرة وطويلة الأمد، كما هو موضح في الشكل التالي. في أسفل الشكل – المناطق التي تتعامل مع أجزاء النص القصيرة؛ في الأعلى – المناطق المسؤولة عن "تراكم السياق" والتي تسمح للشخص بفهم بقية النص بناءً على النص الذي تم سماعه حتى تلك النقطة.
وتظهر نتائج البحث أن المعالجة الهرمية في الدماغ تسمح بالتكامل المرن للمعلومات بمرور الوقت وتوفر رؤى مهمة في علم الأعصاب والتطوير في عالم الذكاء الاصطناعي.
تم دعم البحث من خلال منحة من الأكاديمية الإسرائيلية للعلوم والمعاهد الوطنية للصحة (NIH).
المزيد عن الموضوع على موقع العلوم:
תגובה אחת
غريب جداً. يشير النص إلى عدم فهم كيفية عمل أنظمة LLM. ونقص التحديث (الشاعر ميت منذ زمن طويل)