Abstract
Earthquakes are among the most dangerous natural disasters that can cause major losses to buildings and threaten human lives. The research community is very interested in the topic of earthquakes because they occur suddenly and predicting them is very important for human safety. Creating accurate earthquake prediction techniques by applying machine learning (ML) approaches will help save people\'s lives and prevent damage. To identify important features and analyze the correlation between these features before submitting them to classification models, we proposed a new feature selection approach in this paper which combines two filtering ways: Normalization which is based on the Chi-square approach and analysis of variance, and the correlation approach based on the logistic regression technique (CLR-AVCH). Accordingly, three algorithms are applied. Then a facilitated voting classifier is created that combines the two best models with the highest prediction accuracy (histogram-based gradient boosting, adaptive boosting) to create a single technique that includes the strengths of the techniques that were combined to help find important patterns in the acquired data to obtain a model capable of early prediction of earthquakes. The proposed work achieved higher accuracy, F1_score, recall, and precision (0.94, 0.92, 0.94, 0.92), respectively.
Keywords
الزلازل ، التعلم الآلي ، مصنف التصويت الناعم
Abstract
تعتبر الزلازل من أخطر الكوارث الطبيعية التي يمكن أن تسبب خسائر كبيرة في المباني وتهدد حياة الإنسان. يهتم المجتمع البحثي كثيراً بموضوع الزلازل لأنها تحدث بشكل مفاجئ والتنبؤ بها مهم جداً لسلامة الإنسان. إن إنشاء تقنيات دقيقة للتنبؤ بالزلازل من خلال تطبيق أساليب التعلم الآلي (ML) سيساعد في إنقاذ حياة الناس ومنع الضرر. لتحديد الميزات المهمة وتحليل الارتباط بين هذه الميزات قبل تقديمها إلى نماذج التصنيف، لقد اقترحنا نهجًا جديدًا لاختيار الميزات في هذا البحث والذي يجمع بين طريقتين للتصفية: التطبيع الذي يعتمد على نهج مربع كاي (Chi-square) وتحليل التباين، ونهج الارتباط المعتمد على تقنية الانحدار اللوجستي .(CLR-AVCH) وبناءً على ذلك، تم تطبيق ثلاث خوارزميات. وتم إنشاء مصنف التصويت الميسر الذي يجمع بين أفضل نموذجين يتمتعان بأعلى دقة للتنبؤ ( AdaBoost , HGBoost) ، لتكوين تقنية واحدة تضم نقاط قوة التقنيات التي تم دمجها للمساعدة في العثور على الأنماط المهمة في البيانات المكتسبة للحصول على نموذج قادر على التنبؤ المبكر بالزلازل. حقق العمل المقترح اعلى النتائج بدقة 0.94 و F1_score0.9 وrecall 0.94 وprecision 0.92.
Keywords
Earthquakes
Machine Learning
Soft Voting Classifier