تمت في كلية الادارة والاقتصاد / جامعة بغداد ، مناقشة اطروحة الدكتوراه الموسومة (توظيف بعض النماذج الاحصائية و آلة المتجه الداعم Support Vector Machine (SVM ) في تمييز انماط الوجه) في تخصص الاحصاء للطالبة (سرى صباح كيتب) بأشراف أ.د انـتـصـار عريـبـي فـدعـم
تستكشف هذه الأطروحة استخدام النماذج الإحصائية المختلفة ، بما في ذلك آلة المتجه الداعم (SVM) ، والانحدار اللوجستي (LR) ، ونماذج ماركوف المخفية (HMM) ، لتمييز أنماط الوجه للتعرف على هوية الفرد.
وتصبح مشكلة التعرف على الوجوه أكثر تعقيدا عند التعامل مع البيانات عالية الأبعاد لمصفوفة الصور خاصة عند وجود عدة صور ولقطات مختلفة لنفس الشخص وهي مشكلة حاسمة في السيناريوهات العملية ، لذلك تم استخدام التقنيات الإحصائية الشائعة لحل هذا النوع من المشاكل ومن بين هذه التقنيات التي تم استخدامها في هذه الاطروحة هي تحليل المركبات الرئيسية (PCA) ، تحليل المركبات الرئيسية ثنائية الأبعاد (2DPCA) ، والتحليل التمييزي الخطي (LDA) وهي اساليب خطية يمكن استخدامها لاختزال الأبعاد عن طريق تحويل المساحة للبيانات عالية الأبعاد إلى مساحة أخرى ذات أبعاد أقل دون فقدان المعلومات المهمة حيث تساعد هذه التقنيات على تقليل أبعاد البيانات لتحسين أداء النموذج وضغط البيانات ، وزيادة القدرة على التكيف مع خوارزمية اكتشاف الوجه لأنها تلعب دورا مهما في هذا المجال .
وتم في هذه الاطروحة ايضا اقتراح توظيف بعض طرق اختزال الأبعاد مع النماذج الإحصائية للتعامل مع تعقيد مشكلة التعرف على الوجوه ومن بين هذه الطرق تم استخدام القياس متعدد الابعاد وهي تقنية اختزال ابعاد غير خطية للبيانات عالية الابعاد حيث تعتمد على المسافات بين البيانات في عملية الاختزال حيث تم توظيفها مع ألة المتجه الداعم ومع الانحدارر اللوجستي وكذلك تم اسخدام تحليل المركبات الرئيسية مع ألة المتجه الداعم PCA-SVM)) ويكون عمل هذه الطرق على مرحلتين:اولا، اختزال الابعاد باستخدام طرق اختزال الابعاد ومن ثم استخدام هذه النماذج في عملية التعرف على الوجوه ،حيث اظهرت النتائج كفاءة طريقة MDS في اختزال الابعاد عند توظيفها مع SVM و LR للتعرف على الوجوه حيث اعطت نتائج افضل عند مقارنتها مع طريقة PCA.
تم استخدام معيارين لمقارنة الأساليب المختلفة: متوسط خطأ المربعات (MSE) ومعدل الدقة (ACC), تم تنفيذ استخدام التصنيف في التعرف على الوجوه باستخدام مجموعتي بيانات وعدة عينات (صغيرة ، متوسطة ، كبيرة) ، المجموعة الأولى تمثل قاعدة بيانات ORL (مختبر أبحاث Olivetti and Oracle) ، والتي تتكون من 400 صورة وجه لـ 40 فردا ، مع 10 صور لكل شخص ، المجموعة الثانية تمثل بيانات حقيقية تم جمعها من 100 طالب في كلية المأمون (قسم إدارة الأعمال) وتتكون من 1000 صورة وجه من 100 فرد، مع استخدام بيانات 10 صور لكل شخص لتحقيق أداء الطرق في التعرف على صور الوجه .وقد اظهرت النتئج تحقيق الطرق أقصى معدل دقة بنسبة 100٪ لتحديد صورة الوجه على البيانات الحقيقية ،واظهرت النتائج ايضا أن خوارزمية LDA أعطت أفضل نتيجة من خلال تحقيق أدنى قيمة لـ MSE في جميع أرقام العينات (صغيرة ، متوسطة ، كبيرة) عند مقارنتها مع جميع الطرق المستخدمة.