تمت في كلية الادارة والاقتصاد / جامعة بغداد ، مناقشة اطروحة الدكتوراه الموسومة ( استعمال الطرائق التمهيدية في التحليل العنقودي للبيانات الطولية مع التطبيق العملي ) في تخصص الاحصاء للطالبة (نور نوزت احمد) بأشراف أ.د. سهيل نجم عبد الله
ركز هذه الدراسة على جمع وتحليل البيانات الطولية التي أصبحت شائعة بشكل متزايد، خاصة في المجالات الطبية والاقتصادية، وتم تحليل وتطوير طرائق مختلفة لتحليل هذا النوع من البيانات ، حيث يلعب التحليل العنقودي دورًا مهمًا في تحديد وتجميع الملفات الفرعية ذات الصلة بمرور الوقت. كان الاهتمام في هذه الأطروحة بنموذج B-spline المكعب غير البارامتري، والذي يتميز باستمرارية المشتقتين الأولى والثانية في كل عقدة، مما يؤدي إلى منحنى أكثر سلاسة ومرونة وقادر على التقاط التقلبات في البيانات والأنماط أكثر تعقيدًا. تم استخدام طريقة تجميع العقاب لتجميع ملف البيانات المتوازن طوليًا في مجموعات فرعية عن طريق معاقبة المسافات الزوجية بين معاملات نموذج B-spline المكعب باستخدام إحدى دوال الجزائية. ومن هنا تم اقتراح التجميع باستخدام دالة الجزاء التي تم اقتراحها حديثاً وهي دالة جزائية مقعرةCubic Spline Penalty (CSP) والمستخدمة في عقوبة المسافة الزوجية باستخدام طريقة التجميع الزوجي غير المعلمي NPG. وهذه الطريقة بدورها تحدد عدد العناقيد من خلال أحد معايير اختيار النموذج وهو معايير المعلومات البايزية (BIC)، ونستخدم طرائق التحسين لحل معادلاتها. لذلك قمنا بتطبيق طريقة الاتجاه البديل لخوارزمية مضاعف ADMM للوصول إلى حلول تقريبية لإيجاد مقدرات النموذج غير المعلمي باستخدام البرنامج الإحصائي R. نستخدم أيضًا دالة جزاء أخرى شائعة الاستخدام، وهي minimax concave penalty (MCP) ونستخدم نفس الطريقة في التجميع. ومن ثم تطبيق أسلوب التجميع باستخدام الدالتين الجزائية من خلال دراسة المحاكاة والمقارنة بينهما. كما تم استخدام طريقة التجميع باستخدام خوارزمية K-means وتمت مقارنة نتائجها مع الطريقة NGP المذكورة سابقاً.