تتيح قاعدة بيانات ضخمة وغنية ومبنية على التجارب للنماذج البحث السريع عن الأنماط واقتراح مرشحين جدد. والنتيجة هي قاعدة بيانات إلكترونية مبنية باستخدام نماذج لغوية ضخمة تقرأ وتستخرج البيانات من كم هائل من الأدبيات العلمية.
تُستخدم المغناطيسات القوية في كل مكان تقريبًا، بدءًا من محركات السيارات الكهربائية ومولدات توربينات الرياح، وصولًا إلى مكبرات الصوت وأجهزة الاستشعار والأنظمة الصناعية. تكمن المشكلة في اعتماد العديد من المغناطيسات المتطورة على العناصر الأرضية النادرة، مما يُنشئ اعتمادًا على سلاسل إمداد محدودة، ويُضيف عنصر عدم اليقين إلى الأسعار وتوافرها. لذلك، أصبحت المواد المغناطيسية "البديلة"، التي تُوفر أداءً جيدًا دون اعتماد كبير على العناصر الأرضية النادرة، هدفًا رئيسيًا للبحث العلمي.
تقترح الدراسة الجديدة نهجًا مختلفًا للعثور على هذه المواد. فبدلًا من البدء بعدد قليل من المرشحين واختبارهم في المختبر، قام الباحثون أولًا ببناء البنية التحتية: قاعدة بيانات ضخمة وغنية بالمعلومات، تعتمد على التجارب، تُمكّن النماذج من البحث عن أنماط واقتراح مرشحين جدد بسرعة. والنتيجة هي قاعدة بيانات إلكترونية مبنية باستخدام نماذج شفاه واسعة النطاق، تقرأ وتستخرج البيانات من كم هائل من الأدبيات العلمية.
قاعدة بيانات مبنية على التجارب، وليس على الحسابات فقط.
تضم قاعدة البيانات 67,573 سجلاً لمواد مغناطيسية. يُنظّم كل سجل وفقًا لهوية المادة بوضوح، أي التركيب الكيميائي، والمعلومات البنيوية، والخصائص المغناطيسية. كما تحتوي كل مادة على العديد من الحقول المصممة لتسهيل التعلم الآلي. وتشمل هذه الحقول تفاصيل حول درجات حرارة الانتقال، مثل درجة حرارة كوري أو درجة حرارة نيل، بالإضافة إلى معايير أخرى مهمة لفهم السلوك المغناطيسي.
يؤكد الباحثون أن قيمة قاعدة البيانات تكمن في كونها تستند إلى بيانات تجريبية منشورة في الأبحاث، وليس فقط إلى تنبؤات حسابية. وهذا فرق جوهري في مجال المواد. ففي بعض الأحيان، تُشير الحسابات إلى مغناطيس "واعد"، ولكن عند اختباره في المختبر، تظهر مشاكل تتعلق بالاستقرار، أو الشوائب، أو اختلاف مراحل التبلور. لذا، تُوفر قاعدة البيانات التي تعتمد على النتائج التجريبية نقطة انطلاق أفضل.
لبناء هذه التقنية، جمع الباحثون كمية كبيرة من المقالات التجريبية، وقسموها إلى مقاطع نصية، واستخدموا نماذج لغوية لاستخلاص حقول محددة منها. هذه عملية معقدة، لأن المعلومات لا تظهر دائمًا بنفس الشكل. أحيانًا تكون البيانات في جداول، وأحيانًا في نص متصل، وأحيانًا أخرى يتطلب الأمر تحديد العلاقة بين مادة معينة وقياس أُجري عليها في ظل ظروف محددة. وهنا تكمن قوة النماذج: فهي قادرة على إجراء استخلاص منهجي على نطاق واسع، وهو أمر غير ممكن بالعمل اليدوي.
ماذا فعلوا بقاعدة البيانات، وماذا يعني ذلك بالنسبة للصناعة؟
بعد إنشاء قاعدة البيانات، قام الباحثون بتدريب نماذج عليها لتصنيف المواد وتقييم خصائصها، ثم قاموا بتشغيل هذه النماذج على قواعد بيانات خارجية للبحث عن مواد جديدة مرشحة. وقد أبلغوا عن مجموعة من المواد التي حددتها النماذج على أنها تمتلك القدرة على أن تكون مغناطيسية حتى في درجات الحرارة العالية، مع التركيز على درجات الحرارة التي تزيد عن 500 كلفن، أي ما يزيد عن 227 درجة مئوية تقريبًا.
من المهم هنا التنويه إلى أمرٍ هام. فالمغناطيس "الجيد" للصناعة ليس مجرد مادة ذات درجة حرارة انتقال عالية، بل يتطلب أيضاً خصائص مثل الإكراه المغناطيسي، والتمغنط، والاستقرار الحراري والميكانيكي، والقدرة على إنتاج المادة صناعياً بتكلفة معقولة. لا تُغني قاعدة البيانات عن التجربة، وإنما تهدف إلى تقصير مسارها وتجنب إهدار الوقت في جوانب غير فعّالة.
تكمن الأهمية العملية في إنشاء "مسار سريع". فعند وجود قاعدة بيانات تجريبية ضخمة، يصبح من الممكن تشغيل نماذج عليها، والحصول على قوائم بالمرشحين، وتوجيههم إلى المختبرات القادرة على تصنيعها وقياسها. وبهذه الطريقة، يمكن للبحوث الأساسية أن تتصل بسرعة أكبر باحتياجات صناعات مثل السيارات الكهربائية والطاقة المتجددة. وإذا ما امتد هذا النهج إلى مجالات أخرى، فقد يُغير طريقة البحث عن المواد الوظيفية بشكل عام، وليس فقط المواد المغناطيسية.
إلى المقالة العلمية (مجلة نيتشر كوميونيكيشنز)
المزيد عن الموضوع على موقع العلوم: