استعمال طريقة التقدير المشذب الحصين في حالة وجود قيم شاذة في نموذج الانحدار مع التطبيق العملي

الطالب : خالد جمال كاظم      المشرف أ.م.د. عمر عبد المحسن

 

تمت في كلية الادارة والاقتصاد – جامعة بغداد ،  مناقشة رسالة الماجستير في تخصص الاحصاء للطالب ( خالد جمال كاظم ) بأشراف أ.م.د. عمر عبد المحسن عن رسالته الموسومة ( استعمال طريقة التقدير المشذب الحصين في حالة وجود قيم شاذة في نموذج الانحدار مع التطبيق العملي ).

يهدف هذا البحث الى استعمال أسلوب الحصانة بالتشذيب حيث أن في كثير من الأحيان يفشل تحليل المربعات الصغرى (LS) والإمكان الأعظم (ML) تماماً في حالة وجود قيم شاذة في الظواهر المدروسة. حيث ستفقد OLS وMLE خصائصها ومن ثم تفقد صفة المقدر الجيد (BLUE) (Beast Linear Unbiased Estimator) لما تسببه الشواذ Outliers من تأثير سيئ على الظاهرة المدروسة، ولعلاج هذه المشكلة تم تطوير أساليب إحصائية جديدة بحيث لا تتأثر بالقيم الشاذة بسهولة، إن هذه الطرق تمتاز بالحصانة أو (المقاومة). ولذا كانت طريقة المربعات الصغرى المشذبة (LTS) والامكان الأعظم المشذب (MTL)كبديل جيد يحقق نتائج أكثر مقبولية وأمثليه من الطرق الاعتيادية , ولغرض زيادة كفاءة المقدرات الناتجة تم استخدام أوزان حصينة وتم إدخالها على الطرائق المشذبة حيث أصبحت طريقة المربعات الصغرى المشذبة الموزونة(WLTS)(Weighted Least Trimmed Squares) والامكان الأعظم المشذب الموزون (MWTL)(Maximum Weighted Trimmed Likelihood ) ولتحقيق هذا البحث استدعت الحاجة الكشف والتقصي عن تأثير التلوث مياه نهر دجلة في محافظة واسط بسبب مياه الصرف الصحي وبالذات التلوث بالمواد الصلبة الغير ذائبة في الماء (TDS)  وتأثير ثلاث ملوثات وهي الكبريتات (SO4)  ,الكلوريدات (CL) والفوسفات (PO4) على ذلك .وتم تقديم ذلك بدراسة إحصائية وتقييمها بشكل دقيق ورفعها الى الجهات المختصة ولتحقيق هذا الهدف تم استعمال عينة مسحوبة من مواقع مختلفة وكان حجم هذه العينة (91) وتم سحبها وفحصها في مختبرات بلدية محافظة واسط .وتم إجراء التحليل باستعمال برنامج (MATLAB-2015) .وبعد أن تم الكشف عن وجود القيم الشاذة في المتغيرات المستقلة تبين أن المتغير الذى يمثل (CL)  و المتغير الذى يمثل(SO4) هما فقط يحتويان على قيم شاذة حيث تم إيضاح ذلك بواسطة المصفوفة H وان وجود القيم الشاذة في هذه المتغيرات يكون لها تأثير مباشر على صحة الانسان ومن خلال النتائج التي تم الحصول عليها يمكن ملاحظة ان الاوزان المستعملة أدت الى زيادة كفاءة المقدرات الناتجة , وكذلك لا بد من الإشارة الى تكثيف الاهتمام حول وجود القيم الشاذة في المجالات البيئية كافة لما لها من تأثير ضار على جميع الكائنات الحية .

وقد توصلت الدراسة الى العديد من الاستنتاجات اهمها:

  1. بعد أن تم الكشف عن القيم الشاذة في المتغيرات المستقلة تبين أن الملوث الأول وهو (cl) والملوث الثالث (so4) يحتويان على قيم شاذة أما الملوث الثاني(po4) فلا يحتوي على قيم شاذة وهذا ما بينته عناصر المصفوفة h حيث أن هذه الشواذ تم توضيحها في جدول رقم (3).
  2. إن طريقة المربعات الصغرى الاعتيادية أثبتت عدم جدارتها في تقدير معالم نموذج الانحدار في حالة وجود القيم الشاذة.
  3. تباين النموذج كان مساوي الى 7724 في طريقة المربعات الصغرى الاعتيادية حيث كان تشتت قيم  كبير وذلك بسبب وجود الشواذ.
  4. النتائج التي تم الحصول عليها بطريقة(LTS) أفضل من نتائج طريقة(OLS) حيث في الأولى تم التخلص من الشواذ على عكس الثانية، ويتضح ذلك من خلال كفاءة الانموذج وأيضا من خلال معيار المقارنة(RMSE)حيث كان مساوي الى 3022 في طريقة LTS) أما في طريقة (OLS)فقد كان مساوي الى 5.4865.
  5. عند إستخدام طريقة( W LTS) وبالتحديد عند نقطة القطع c=1.5 كانت المعالم المقدرة هي أفضل ما يمكن حيث أدت الى تقليل تباين الخطأ ومعيار المقارنة) RMSE (عند هذه النقطة كان مساوي الى( 8378).
  6. مقدرات الإمكان الأعظم هي نفسها مقدرات المربعات الصغرى الاعتيادية بالنسبة لمعالم انموذج الانحدار وهذا يؤدي الى أن طريقة الإمكان الأعظم أثبتت عدم جدارتها في تقدير معالم نموذج الانحدار.

وفي ضوء الاستنتاجات التي توصلت اليها الدراسة يوصي الباحث بما يلي :

  1. تكثيف الاهتمام حول وجود القيم الشاذة في بيانات الظاهرة المدروسة وذلك بسبب صعوبة توفر الظروف المثالية للظاهرة المدروسة بسبب التغيرات التي تحدث حول هذه الظاهرة.
  2. استعمال طرائق التقدير الحصينة الأخرى على سبيل المثال طريقة Maximum Median Likelihood) )(MML) وبقية الطرق الأخرى التي لم يتم التطرق لهذه الطرائق من قبل الباحثين بصورة كبيرة، وكذلك معرفه خصائص مقدرات هذه الطرق وكذلك حساسيتها وتأثرها تجاه وجود الشواذ.
  3. التقليل من استعمال المواد المسببة للتلوث وعدم استعمالها بكثرة للحفاظ على البيئة.
  4. زيادة كفاءة محطات معالجة مياه الصرف الصحي في معالجة التلوث والاهتمام بها من ناحية الأجهزة المختبرية والمعدات اللازمة والمتطورة لعمل هذه المحطات على أتم وجه، ومحاوله التقليل من وجود هذه الملوثات وعدم رميها في مياه الأنهر بصورة مباشرة الا بعد التخلص من هذه الملوثات الضارة.
  5. زيادة الوعي البيئي ويتم ذلك من قبل مختصين في مجال البيئة والصحة حيث يتم ذلك عن طريق عمل دورات تثقيفية في مجال المحافظة على البيئة أو عن طريق عمل بعض المنشورات أو الإعلانات الدعائية والتي تهدف الى زيادة الوعي البيئي لدى كافة الناس.