اللغة وراء الكلمات

كشف علماء معهد وايزمان للعلوم أن لحن الكلام الإنجليزي يتصرف مثل اللغة من حيث المفردات والقواعد النحوية، مما يمهد الطريق للذكاء الاصطناعي لفهمه.


إنها قاعدة لغوية بسيطة مكّنت ثورة الذكاء الاصطناعي التي غيّرت حياتنا في السنوات الثلاث الماضية. تعتمد نماذج اللغة، مثل دردشة GPT، على حقيقة أن الكلمات في اللغة الطبيعية لا تظهر واحدة تلو الأخرى بشكل عشوائي، بل لها بنية إحصائية تسمح بتخمين الكلمة التالية في المحادثة بناءً على سابقاتها. ومع ذلك، فإن النماذج تفتقد إلى عالم كامل من المحتوى في الخطاب الإنساني، والذي لا يتم نقله على الإطلاق في الكلمات نفسها. وفي دراسة جديدة، توصلت نتائجها إلى يتم نشرها اليوم في المجلة العلمية "سجلات الأكاديمية الأمريكية للعلوم" (PNAS), كشف علماء معهد وايزمان للعلوم من مختبر البروفيسور إليشع موسى لأن موسيقى الكلام في المحادثات الإنجليزية العفوية تتصرف مثل اللغة الحقيقية، مع "مفردات" مكونة من عدة مئات من الألحان الأساسية وحتى قواعد بناء الجملة التي تتنبأ بما سيكون عليه اللحن التالي في التسلسل. ومن خلال القيام بذلك، يمهد البحث الطريق للذكاء الاصطناعي الذي سيفهم اللغة بما يتجاوز الكلمات.

تشمل موسيقى الكلام، والتي يطلق عليها اللغويون "علم العروض"، تغييرات في درجة الصوت (التجويد)، وارتفاع الصوت (مثل الضغط)، وإيقاع الكلام، وجودة الصوت (مثل الهمس أو بحة الصوت). لقد تطورت هذه الوسيلة للتعبير قبل الكلمات، وأظهرت الدراسات الحديثة أن نداءات الشمبانزي وأغاني الحيتان تتضمن هياكل عروضية معقدة. في الثقافة الإنسانية، يحمل علم العروض معنى لا يتم نقله غالبًا من خلال الكلمات - فتوقف قصير في الكلام، مثل الفاصلة، يمكن أن يغير معنى الجملة تمامًا (دعونا نأكل الجدة) ويمكن أن يؤدي إيقاع النص إلى جعله متوترًا. في الماضي، ركزت دراسة علم العروض على الأعمال الأدبية وكيفية انعكاس علم العروض على التغيرات التاريخية. وهكذا، وعلى الرغم من أهميتها الحاسمة لفهم اللغة البشرية، فقد اعتبرت دراستها لسنوات عديدة مجالاً ضيقاً وغير تطبيقي، وتطورت نظريات متضاربة فيما يتصل ببنيتها ومعناها.

"النموذج الذي ابتكرناه هو أداة تسمح لنا بملء فجوات عمرها قرون في دراسة التعبير بما يتجاوز الكلمات - في كل لغة بشرية وعبر مختلف الشعوب الناطقة."

ومع ذلك، فإن علم العروض موجود في كل محادثة لدينا، فهو يحدد الوظيفة اللغوية للكلمات - على سبيل المثال، ما إذا كانت تطرح سؤالاً أو تشير إلى حقيقة - ويكشف أيضًا عن موقف المتحدث ومشاعره حول ما يقال. في الدراسة الجديدة، قام فريق من الباحثين بقيادة عالم اللغويات الدكتور ناداف ماتالون وعالم الأعصاب الدكتور إيال وينريف من مختبر البروفيسور موزيس في قسم فيزياء الأنظمة المعقدة، بدراسة علم العروض كما لو كان لغة جديدة وغير معروفة، وحاولوا تقديم إجابة قائمة على البيانات للغموض اللغوي لبنية علم العروض ومعناه. وبدلاً من استكشاف الأصول الثقافية، ركز الباحثون على قاعدتي بيانات كبيرتين لتسجيلات المحادثات العفوية، إحداهما لمحادثات هاتفية بين اثنين من المشاركين والأخرى لمحادثات وجهاً لوجه في المطبخ والفصول الدراسية والمزيد.

كانت المهمة الأولى هي تجميع قاموس للألحان القصيرة، التي تشكل "الكلمات" في لغة العروض الإنجليزية، وتعيين وظيفة ومعنى لكل منها. "لفهم سبب عدم وجود قاموس عروضي حتى الآن، من الأفضل أن نتذكر أنه حتى القرن التاسع عشر لم يكن هناك قاموس شامل للغة الإنجليزية على الإطلاق"، كما يقول البروفيسور موسى. "عندما تم تكليف جامعة أكسفورد بالمشروع، تمت دعوة الجمهور للمساعدة في تحمل عبء العمل وإرسال اقتباسات توضح التغييرات التاريخية في معنى الكلمات." وكان أحد المساهمين الرئيسيين في القاموس سجينًا أمضى أكثر من عشرين عامًا في قراءة الكتب وإرسال الاقتباسات. "بدلاً من جمع المعلومات بأنفسنا لعقود من الزمن، قمنا بتحليل قواعد بيانات كبيرة من التسجيلات باستخدام الذكاء الاصطناعي."

وعلى الرغم من أن لحن كلام كل شخص فريد من نوعه، فقد تمكن نموذج الذكاء الاصطناعي من تحديد عدة مئات من الأنماط الأساسية، والتي تتكرر مع اختلافات طفيفة في جميع المحادثات الإنجليزية العفوية. في حين أن الكلمة المكتوبة عبارة عن سلسلة من الحروف، فإن "الميل" في لغة علم العروض هو لحن قصير، أي سلسلة من التغييرات في درجة الصوت تستمر لمدة ثانية واحدة في المتوسط. وللتوصل إلى معناها، قام الدكتور ماتالون بإنشاء نموذج لعشرين نمطًا أساسيًا من هذا القبيل واستمع إلى التسجيلات مرة أخرى. "لقد اتضح أن كل نمط لديه العديد من الوظائف اللغوية"، كما يوضح. "يمكنه، على سبيل المثال، تعريف الكلمات المنطوقة على شكل سؤال أو بيان اعتمادًا على السياق." ومع ذلك، فإنه غالبا ما يكون له معنى واحد فيما يتعلق بموقف المتحدث تجاه ما يقال، مثل الفضول، والمفاجأة، والارتباك، وأكثر من ذلك. من أمثلة "الكلمة" الشعرية الارتفاع الحاد في درجة الصوت الذي يتبعه انخفاض حاد. يعبر هذا النمط عن الحماس ويمكنه، في سياقات مختلفة، أن يؤدي الوظيفة اللغوية المتمثلة في الاتفاق القوي أو تأكيد استلام معلومات جديدة ومهمة.

وفي الخطوة التالية، حاول العلماء تحديد القواعد النحوية التي تنظم الأنماط العروضية واحدة تلو الأخرى، بطريقة تسمح لنماذج اللغة المستقبلية بفهم العروض واستخدامها. "لاحظنا أن هناك أزواجًا من الأنماط تميل إلى الظهور معًا بشكل أكبر في الكلام التلقائي"، كما يقول الدكتور وينيرف. "إنه نظام إحصائي بسيط، حيث يعتمد الاختيار الصحيح للوحدة التالية في التسلسل على الوحدة السابقة فقط." "إن مثل هذا النظام مناسب للمحادثات العفوية، لأنه يتطلب التخطيط قبل ثوانٍ قليلة فقط، وهي مدة الذاكرة قصيرة المدى." تحولت الأزواج إلى جمل بسيطة تعبر عن "فكرة جديدة"، بحيث يشير كل زوج إلى موضوع محدد ويقول شيئًا واحدًا عنه، على سبيل المثال، الإشارة إلى حقيقة تم ذكرها في المحادثة وتقديم استجابة إيجابية.

المزيد عن الموضوع على موقع العلوم: