الاساليب الاحصائية

تمت في كلية الادارة والاقتصاد / جامعة بغداد ، مناقشة رسالة الماجستير الموسومة ( نمذجة البيانات الضخمة باستعمال الاساليب الاحصائية وتقنيات التعلم العميق ) في تخصص الإحصـاء للطالب (كرار عبدالرضا احمد) بأشراف أ. د. صباح منفي رضا

تهدف هذه الرسالة إلى دراسة وتصنيف تلوث مياه الأبار(المياه الجوفية) في العراق من خلال توظيف مجموعة من الأساليب الإحصائية المنتظمة وتقنيات الذكاء الاصطناعي الحديثة، اعتمادًا على بيانات بيئية حقيقية مقدمة من وزارة البيئة العراقية، إضافة إلى بيانات محاكاة مولدة باستخدام أسلوب مونت كارلو. وتم التركيز على نماذج الانحدار اللوجستي الجزائي، ولا سيما طرائق LASSO وAdaptive LASSO وSCAD وNet Elastic، إلى جانب خوارزميات التعزيز التدريجي، وبخاصة خوارزمية XGBoost، بهدف تقييم كفاءتها التفسيرية والتنبؤية عند التعامل مع بيانات بيئية متعددة المتغيرات وذات ارتباطات عالية. وتتمثل مشكلة البحث في الحاجة إلى بناء إطار تحليلي متكامل يجمع بين قابلية التفسير التي توفرها نماذج الانحدار اللوجستي الجزائي والكفاءة التنبؤية التي تتميز بها خوارزميات التعزيز التدريجي، ولا سيما XGBoost، عند تحليل وتصنيف بيانات تلوث مياه نهر دجلة.

وقد توصلت الدراسة الى عدد من الاستنتاجات اهمها :

  1. أظهرت نتائج المحاكاة أن طريقة Elastic Net كانت الأفضل أداءً بين طرائق الانحدار المنتظم، حيث حققت أقل قيم لمعيار متوسط مربع الخطأ (MSE) عند جميع أحجام العينات.
  2. بينت نتائج المحاكاة أن خوارزمية XGBoost تفوقت على خوارزمية Gradient Boosting، وحققت أدنى قيم لمعيار (MSE) عبر مختلف أحجام العينات.
  3. أظهرت نتائج التطبيق العملي أن جميع المتغيرات البيئية المدروسة كانت ذات دلالة إحصائية عالية في كل من نموذج Elastic Net وخوارزمية XGBoost.
  4. أوضحت نتائج Elastic Net أن متغيرات HCO3 وSO4 وCa وK وpH لها تأثير موجب في مستوى تلوث المياه، في حين كان لكل من NO3 وCl وMg وNa وTDS تأثير سالب.

ومن خلال الاستنتاجات التي توصلت اليها الدراسة قدم الباحث عدد من التوصيات اهمها :

  1. اعتماد طريقة Elastic Net في الدراسات البيئية التفسيرية التي تتضمن متغيرات مترابطة.
  2. اعتماد خوارزمية XGBoost في التطبيقات التي تتطلب دقة تنبؤية عالية.
  3. توصي الدراسة وزارة البيئة بالتركيز على المتغيرات المؤثرة ضمن برامج الرصد البيئي.
  4. تشجيع استخدام تقنيات الذكاء الاصطناعي في تحليل بيانات جودة المياه.

 

Comments are disabled.