تمت مناقشة اطروحة الدكتوراه في الاحصاء للطالبة ( سهاد احمد احمد ) عن اطروحتها الموسومة ( استعمال اشجار الانحدار التصنيفية CART في تقدير نموذج تجمعي مع تطبيق عملي ) ، وتألفت لجنة المناقشة من السادة الاعضاء الافاضل :
• أ.د. محمد صادق عبد الرزاق – كلية الادارة والاقتصاد / جامعة بغداد : رئيساً.
• أ.د. عبد الرحيم خلف راهي – كلية الادارة والاقتصاد / جامعة المستنصرية : عضواً.
• أ.م.د. فارس طاهر حسن – كلية الادارة والاقتصاد / جامعة بغداد : عضواً.
• أ.م.د. صباح منفي رضا – كلية الادارة والاقتصاد / جامعة بغداد : عضواً.
• أ.م.د. وليد عبد الله رحيمة – الكلية الادارية التقنية : عضواً.
• أ.م.د. عمر عبد المحسن علي – كلية الادارة والاقتصاد / جامعة بغداد : مشرفاً.
وكان الخبير العلمي هو أ.م.د. عصام حسين خضر – كلية اقتصاديات الاعمال / جامعة النهرين ، والخبير اللغوي م. رافد صباح رضا – كلية الادارة والاقتصاد / جامعة بغداد.
غالباً ما تعاني الظواهر من وجود حالة اضطراب في بياناتها بالإضافة الى صعوبة صياغتها وخصوصاً مع وجود عدم وضوح في استجابتها، أو لكثرة الاختلافات الجوهرية التي تعتري الوحدات التجريبية التي تم أخذ هذه البيانات منها. فعندما تزداد المجاميع لمجتمع ما, لا يمكن اعتبار ذلك المجتمع متجانس لأن التشتت يزداد بين استجابة الوحدات التجريبية لذلك المجتمع وكذلك الخطأ سوف يزداد أيضاً ويكون من الصعوبة بناء نموذج لذلك المجتمع.
لذا برزت الحاجة إلى طريقة تقدير تشتمل على تصنيف أو تمييز ضمني لهذه الوحدات التجريبية باستعمال أسلوب تمييز أو إنشاء قطاعات لكل صنف من اصناف هذه الوحدات التجريبية أملاً في السيطرة على استجاباتها وجعلها أكثر انسجاماً.
فقد تم اللجوء الى استعمال اسلوب تصنيف حديث ومرن يستند الى جوارات بين مشاهدات متغير الاستجابة متمثلة بأشجار الانحدار التصنيفية، وتم استعمال الاسلوب البيزي وما يتضمنه من ميزات استدلالية لتحليل نموذج تصنيف الانحدار الشجري للإفادة من المعلومات السابقة من جانب، ولتجميع الأشجار للمتغيرات التوضيحية كلها معاً وعند كل مرحلة تفرّع من جانب آخر متمثلة باشجار الانحدار التصنيفية البيزية.
ونظراً للتطوّر الحاصل في مجال الحاسبات وأخذاً بمبدأ تكامل العلوم فقد وجد أن الخوارزميات الحديثة المستعملة في مجال علوم الحاسبات كخوارزمية النمل أو خوارزمية النحل أو خوارزمية سرب الطيور وغيرها المستعملة أصلاً لأغراض تقنية تخص التمييز بين الصور أو الذبذبات الراديوية وغيرها، يمكن تسخيرها لخدمة علم الاحصاء الذي يستند بدوره على انتاج المعلومات وأن تحقق نجاحاً في ذلك، ولذا تم استعمال الخوارزمية الجينية وتقديم مقترح عنها كخوارزمية مطوّرة، بالإضافة الى خوارزميتي (C4.5 و ID3) ، ولعدم فقدان التعميم تم استعمال التحليل اللوجستي كأداة تحليل مهمة.
وتم اجراء ما تقدم كله جنباً الى جنب مع تقدير النموذج التجميعي العام أزاء كل طريقة تصنيف من الطرق المذكورة في أعلاه. باعتباره اسلوب لامعلمي حديث ومرن يتغلب على مشكلة البعدية التي قد تعتري معظم ظواهر العصر الحديث عند تحليل بياناتها.
وتم الاستعانة بالمحاكاة بأحجام عينات مختلفة (600, 400, 200) وبتكرارات (1000) مرة، فيما تم إجراء التطبيق على بيانات مرضى السكري لمن يبلغون من العمر (15) سنة فأقل مأخوذة من عينة بحجم (200) مفردة تم سحبها من مستشفى الطفل في الاسكان/ بغداد.
أما اثبات جودة التصنيف فقد تم باستعمال معيار خطأ التصنيف أما اثبات جودة التقدير فقد تم باستعمال معيار جذر متوسط مربعات الخطأ.
وتم التوصل الى أهم الاستنتاجات من خلال إجراء عملية المفاضلة بين الطرائق السبعة أعلاه، بتفوّق الخوارزمية الجينية المقترحة الى جانب الاسلوب اللوجستي هما الأفضل من حيث النتائج التي تم التوصل إليها في الجانبين التجريبي والتطبيقي.