تمت في كلية الادارة والاقتصاد جامعة بغداد ، مناقشة رسالة ماجستير في تخصص الاحصاء للطالبة (شيماء ابراهيم خليل) بأشراف أ.م. غفران اسماعيل كمال عن رسالتها الموسومة ( استعمال بعض الطرائق الحصينة لتقدير إنموذج الانحدار الخطي المتعدد عند عدم تحقق تجانس تباين الاخطاء ووجود قيم شاذة مع تطبيق عملي).
إن أنموذج الانحدار الخطي المتعدد هو احد النماذج الخطية المستعملة على نطاق واسع في الاحصاء، بسبب تطبيقاته في مختلف العلوم الانسانية والاقتصادية والبحوث البيئية وغيرها من العلوم التطبيقية، والذي من خلاله يتم التأكد من دقة الاستدلال والحصول على نتائج ومقدرات ذات كفاءة عالية .
تعد مشكلة عدم تجانس تباين الخطأ واحدة من ابرز المشاكل التي تواجه الباحثين عند بناء مثل هذا الانموذج، بالإضافة الى ذلك ظهور القيم الشاذة في بياناته والتي توثر بشكل كبير على مقدراته وتجعلها غير دقيقة، لهذا السبب تم تعزيز وتطوير الطرائق الحصينة التي تتميز بمعالجة مشكلة عدم تجانس تباين الخطأ ومقاومتها للقيم الشاذة بنفس الوقت، والحصول من خلالها على تقديرات كفوءة .
ولقد تناولت هذه الرسالة بعض من اهم الطرائق الحصينة، هي طريقة المربعات الصغرى الموزونة الحصينة (RWLS) وطريقة المربعات الصغرى الموزونة ذات المرحلتين (TSRWLS) وطريقتي التمهيد الحصينة استناداً الى (Wu ولـ Liu) (RBoot Wu MM) (MM RBoot Liu ) من اجل تحديد افضل المعلمات لأنموذج الانحدار الخطي المتعدد.
الهدف مـن هـذا البحث بالدرجة الأساس تسليط الضوء على البيانات التي تحتوي على بعض من المشاكل التي تواجه الباحثين والعاملين في مختلف القطاعات العلمية والحياتية ، وهما مشكلة عدم تجانس تباين الخطأ والقيم الشاذة (الملوثة)، والتوصل الى افضل التقديرات للأنموذج الخطي المتعدد، وذلك باستعمال (طرائق حصينة) والمقارنة بين هـذه الطرائق لاختيار افضلها، وتم ذلك باستعمال محاكاة مونتي كارلو ومن خلال معيار المقارنة متوسط الخطأ النسبي المطلق (MAPE)، وتطبيقها على بيانات حقيقية مأخوذة مـن أمانة بغداد / دائرة مـاء بغداد /قسم السيطرة النوعية للعـام (2019 م) .
وقد توصلت الدراسة الى عدد من الاستنتاجات اهمها :
- ان اختبار (Goldfeld-Quandt) المعدل، اظهر اداءً جيداً في الكشف عن مشكلة عدم تجانس تباين الخطأ دون التأثر بالقيم الشاذة .
- في الجانب التجريبي أثبتت طريقة ( TSRWLS) كفاءة عالية في تقدير معلمات إنموذج الانحدار الخطي المتعدد ، في حالة ظهورمشكلة عدم تجانس تباين الخطأ ووجود القيم شاذة في البيانات، وحققت افضل النتائج في اغلب تجارب المحاكاة ، كونها حققت اقل قيمة لمتوسط الخطأ النسبي المطلق (MAPE) للأنموذج مقارنة مع طرائق التقدير الحصينة المدروسة.
- أثبتت طريقة ( TSRWLS) في الجانب التجريبي كفاءة عالية في تقدير معلمات إنموذج الانحدار الخطي المتعدد ، والافضل لكافة حجوم العينات الصغيرة والكبيرة ولنسب التلوث المختلفة .
- في الجانب التطبيقي اصبحت طريقة (TSRWLS) هي الافضل والاكفأ في تقدير المعلمات لأنموذج الانحدار الخطي المتعدد، وهذا ما تم اثباته في المحاكاة لمونت كارلو وتطبيقه في العملي.
ومن خلال الاستنتاجات التي توصلت اليها الدراسة قدم الباحث عدد من التوصيات :
- حث الاحصائيين والمحللين للبيانات على اعتماد اختبارات وطرائق احصائية ، تتأثر بالحد الادنى من القيم الشاذة .
- الاعتماد على طريقة ( TSRWLS) في تقدير معلمات إنموذج الانحدار الخطي المتعدد في حالة كون البيانات تعاني من مشكلة عدم تجانس تباين الخطأ وظهورالقيم الشاذة فيها، لكونها حققت اقل قيمة لـ( MAPE) من بين الطرائق الحصينة للتقدير .
- تطوير واستعمال مقدرات حصينة اخرى ، لتصحيح مشكلة عدم تجانس تباين الاخطاء بوجود القيم الشاذة.
- اجراء المزيد من التجارب والدراسات حول موضوع مشكلة عدم تجانس تباين الخطأ وظهور القيم الشاذة في بيانات النماذج الاحصائية الاخرى.
- يتم متابعة التجارب والدراسات الخاصة بمشكلة عسره المياه، وتسجيل جميع البيانات مع اي تفسير ممكن لها تخص الزيادة او النقصان للعسرة، لمعرفة مدى تأثيرها على صحة الانسان .