تمت في كلية الادارة والاقتصاد / جامعة بغداد ، مناقشة اطروحة الدكتوراه الموسومة (تقدير دالة البقاء للأنموذج شبه المعلمي باستعمال طرائق التعلم الألي مع تطبيق عملي)في تخصص الاحصاء للطالبة (نــــور أيـــاد مـحــمــد) بأشراف أ.د. انـتـصـار عريـبـي فـدعـم .
تناولت الدراسة موضوع تقدير دوال البقاء الذي يعد من موضوعات علم الاحصاء ذات الاهمية المتزايدة كونها تجمع ما بين الجانب الاحصائي، الطبي والبيولوجي، اذ تستعمل لدراسة العلاقة ما بين الوقت واحتمالية البقاء، وتزداد اهمية هذا الموضوع عند ربط طرائق تقديره بأساليب ذكاء اصطناعي حديثة وذات دقة عالية مثل اسلوب التعلم الالي.
فيما يخص انموذج الاطروحة فقد اعتمد انموذج Cox والذي يعتبر من اكثر النماذج الاحصائية المستعملة في تقدير البقاء للبيانات الطبية، وهو من النماذج الشبه المعلمية المهمة والشائعة الاستعمال لتقدير البقاء، اذ ان الجزء اللامعلمي له عادة ما يقدر بطرق لامعلمية محددة ومكررة اما الجزء المعلمي فتقدر معلماته عادة بطريقة الامكان الاعظم الجزائية. ولكن بدلا من تقدير الجزء اللامعلمي له بالطرائق التقليدية المكررة والتي لا يمكنها التعامل مع مشاكل بيانات البقاء الحالية والتي منها: الابعاد العالية للمتغيرات المدروسة وخصوصا بيانات الصور الطبية، وجود ارتباطات بين المتغيرات، البيانات المراقبة، حجوم العينات الكبيرة الناتجة من تطور اساليب جمع وخزن البيانات. وعليه فبوجود هذه المشاكل لا يمكن استعمال انموذج Cox الشبه المعلمي.
لذا كان لابد من اللجوء الى استعمال اساليب حديثة لتقدير الجزء اللامعلمي لها القدرة على التعامل مع مشاكل بيانات البقاء الحالية، ومن هذه الاساليب هو اسلوب التعلم الالي ( وهو فرع من فروع الذكاء الاصطناعي).
اذ ان اليه عمل اسلوب التعلم الالي تتطلب اولا توفر البيانات الخاصة بالحالة المدروسة، وبالتالي فأن البيانات الخاصة بالجزء اللامعلمي لانموذج Cox تمثل صور جهاز الماموكرام الحقيقية لمرضى سرطان الثدي في العراق، ومن بعد توفر البيانات تم تطبيق اسلوب التعلم الالي عليها من خلال تنفيذ ستة خوارزميات لاستخلاص الميزات المهمة من كل صور وهي PCA، KPCA، Fast ICA، NMF، Truncated SVD، CNN مع خمسة خوارزميات من خوارزميات التعلم الالي لتقدير البقاء وهي: KNN ، Decision tree ، Random forests ، SVM، Gradient Boosting.
تم اعتماد معيارين للمقارنة ما بين النماذج هي MSE وC-Index والتي من خلالها اتضح ان افضل انموذج لتقدير البقاء كان الانموذج الناتج من تطبيق خوارزمية Truncated SVD مع Gradient Boosting.
كما تم اجراء تعديل الى خمسة خوارزميات من خوارزميات التعلم الالي لتقدير البقاء للجزء اللامعلمي لانموذج Cox من خلال اجراء عملية استخلاص المتغيرات المهمة على مرحلتين المرحلة الاولى تتضمن اسنخلاص الميزات بأستعمال خوارزمية CNN وبعدها تطبيق الخوارزميات الاخرى للمتغيرات المستخلصة والتي من خلال النتائج اتضح ان افضل انموذج معدل هو الانموذج الناتج من استعمال خوارزمية CNN مع PCA مع خوارزمية Gradient Boosting.
اما بيانات الجزء المعلمي لانموذج كوكس فهي مجموعة من المتغيرات المؤثرة بالمرض ولنفس مجموعة المرضى، وتم تقدير معلمات هذا الجزء باستعمال طريقة الامكان الاعظم الجزائية.