سوف يقوم الذكاء الاصطناعي باستعادة النصوص اليهودية القديمة

قرر طلاب السنة الرابعة في قسم هندسة البرمجيات ونظم المعلومات في جامعة بن غوريون في النقب إنتاج إجابة حديثة للكتابات القديمة وبتوجيه من البروفيسور مارك ليست، قاموا بتطوير ذكاء اصطناعي النظام الذي يكمل الأقسام المفقودة في النصوص القديمة

استخدام الذكاء الاصطناعي لفك رموز النصوص القديمة. الصورة من إعداد دالي وهي لأغراض توضيحية فقط ولا ينبغي اعتبارها صورة علمية
استخدام الذكاء الاصطناعي لفك رموز النصوص القديمة. الصورة من إعداد دالي وهي لأغراض توضيحية فقط ولا ينبغي اعتبارها صورة علمية

تعتبر الاكتشافات الأثرية القديمة المتعلقة بالشعب اليهودي مهمة لتعزيز الهوية والارتباط بالثقافة والتاريخ، لكن الكثير منها تمزق أو تلاشت على مر السنين. قام طلاب من قسم هندسة البرمجيات ونظم المعلومات في جامعة بن غوريون في النقب بتطوير نظام ذكاء اصطناعي ينجح في إكمال الأقسام المفقودة، بما في ذلك الأحرف المفردة، الكلمات الكاملة أو أجزاء من الكلمات، كجزء من مشروعهم النهائي. المشروع كانت مقدمة عُقد مؤخرًا في مؤتمر أوروبا الوسطى للغويات الحاسوبية (EACL 2024) الذي انعقد في جزيرة مالطا. 

تعتبر النقوش بالعبرية والآرامية مصدرًا أساسيًا للمعلومات حول التاريخ القديم للشرق الأدنى. ولسوء الحظ، أصبحت بعض أجزاء النصوص غير مقروءة مع مرور الوقت. يستخدم خبراء خاصون، يطلق عليهم علماء النقوش (فك رموز النقوش)، إجراءات يدوية لتقييم المحتوى المفقود، لكن هذا الإجراء يستغرق وقتًا طويلاً وفي كثير من الحالات لا يوصل الباحثين إلى استنتاجات لا لبس فيها.

نيف بونو، هاريل موشيوف، إلدر كارول، وإيتي أشرف، قرر طلاب السنة الرابعة في قسم هندسة البرمجيات ونظم المعلومات في جامعة بن غوريون في النقب إنتاج رد حديث على الكتابات القديمة وبتوجيه من البروفيسور مارك ليستطور نظام ذكاء اصطناعي يكمل الأقسام المفقودة في النصوص القديمة.

وتعد هذه الدراسة الأولى من نوعها التي تطبق نظام الذكاء الاصطناعي لاستكمال النقوش التالفة باللغتين العبرية والآرامية القديمة، وذلك باستخدام حروف الأبجدية العبرية التي تتكون بشكل رئيسي من الحروف الساكنة. ويجمع نموذج "المجموعة" الذي طوروه بين عدد من النماذج المدربة على آيات الكتاب المقدس باللغتين العبرية والآرامية، على افتراض أن لغة الكتاب المقدس (بدون علامات الترقيم) أقرب إلى لغة الكتابات القديمة مقارنة باللغة العبرية الحديثة. حتى الآن، تم تطبيق عدد من النماذج التي تنبأت بالكلمات الكاملة بشكل جيد، ولكن التنبؤ بأجزاء الكلمة أو الأحرف المفقودة كان أقل جودة. 

تقديم نموذج "الفرقة". الائتمان: الشيخ كارول

اعتمدت طريقة البحث على 1,071 آية تم اختيارها عشوائيا من الكتاب المقدس (536 للاختبار و 536 للتحقق كمجموعة ضابطة). أما الآيات الكتابية المتبقية وعددها 22,144 آية فقد تم استخدامها لضبط معلمات النماذج المدربة مسبقا على قواعد بيانات النصوص العبرية الحديثة لتتوافق مع المتغيرات. النصوص العبرية القديمة. يقوم المستخدم بإدخال نص في النظام يتضمن الأجزاء المفقودة، وبالنسبة للأجزاء المفقودة، سيعرض النظام عدة خيارات، بما في ذلك احتمال كل إكمال محتمل - كلمة واحدة أو حرف أو كلمة جزئية.

رابط لصورة المجموعة البحثية. من اليمين إلى اليسار: البروفيسور مارك ليست، الشيخ كارول، هاريل موشيوف، نيف بونو، إيتاي أسرف. تصوير: عمر يادغار
رابط لصورة المجموعة البحثية. من اليمين إلى اليسار: البروفيسور مارك ليست، الشيخ كارول، هاريل موشيوف، نيف بونو، إيتاي أسرف. تصوير: عمر يادغار

وقد تبين أن نموذج "المجموعة" مفيد للغاية في ترميم النقوش العبرية والآرامية التالفة. وقال البروفيسور ليست: "نعتقد أن هذا النهج يمكن توسيعه بسهولة ليشمل كتابات باللغات القديمة الأخرى الغنية شكليا". وأضاف: "في قدرتنا على مساعدة المؤرخين الذين يشاركون في إعادة بناء المخطوطات والكتابات اليهودية القديمة كمهمة حياتهم لإكمال النص المفقود بأكبر قدر ممكن من الدقة."

تم تقديم الورقة البحثية المبنية على المشروع النهائي في مؤتمر أوروبا الوسطى للغويات الحاسوبية (EACL الذي عقد مؤخرًا في جزيرة مالطا). 

المزيد عن الموضوع على موقع العلوم:

الردود 3

  1. هناك أيضًا مسألة حقوق الطبع والنشر، والتي يشعر المصورون بالغيرة منها لدرجة أنهم يستطيعون المطالبة بما يعادل دخل الموقع لمدة ثلاث سنوات مقابل صورة واحدة.

  2. أصبح الموقع مهووسًا بالصور التي تم إنشاؤها في DALEE.
    سأكون أكثر سعادة إذا حصلت على صورة ذات صلة بالمحتوى.
    شيء يمكنك التعلم منه، وليس صورة توضيحية غير ضرورية مصنوعة باستخدام الذكاء الاصطناعي.

ترك الرد

لن يتم نشر البريد الإلكتروني. الحقول الإلزامية مشار إليها *

يستخدم هذا الموقع Akismat لمنع الرسائل غير المرغوب فيها. انقر هنا لمعرفة كيفية معالجة بيانات الرد الخاصة بك.