الطالب: حيدر يحيى محمد     المشرف:  أ.د. لقاء علي محمد

تمت في كلية الادارة والاقتصاد جامعة بغداد ، مناقشة اطروحة دكتوراه في تخصص الاحصاء للطالب (حيدر يحيى محمد ) بأشراف أ.د. لقاء علي محمد ، عن اطروحته الموسومة (استخدام الدوال اللبية للمواءمة بين اسلوبي التحليل العاملي والعنقودي مع تطبيق عملي ).

التعامل مع بيانات متعددة المتغيرات ذات الابعاد العالية غالبا ما نستخدم تحليل المركبات الرئيسة لتقليل الأبعاد , ويتميز تحليل المركبات الرئيسة بقدرته على تقليل المتغيرات الكثيرة وترتيبها في عدد ضئيل من المتغيرات الفرضية التي تعكس التباين المشترك العام بين مجموعة من المتغيرات , وتدعى بالعوامل وتكون غير مرتبطة مع بعضها البعض.

في حالة البيانات اللامعلمية يتم التعامل مع تحليل المركبات الرئيسة اللبي لانه يعطي نتائج موثوقة ودقيقة , ولكن في حالة وجود قيم متطرفة ضمن المشاهدات المدخلة فأنه لا يعالجها, ولغرض ازالة تأثير القيم المتطرفة نستخدم احد اساليب الحصانة بعد استخدام الدوال اللبية للتخلص من مشكلة اللامعلمية , بعد هذه المرحلة يتم تطبق التحليل العنقودي على المركبات الرئيسة اللبية الحصينة المؤثرة باعتبارها متغيرات جديدة , والمتغيرات الاصلية الظاهرة بالعوامل نعتبرها مشاهدات, حيث تبدأ الطريقة مع k من العناقيد العشوائية ومن ثم تحريك (نقل) المتغيرات بين هذه العناقيد مع العمل على  تصغير الإختلافات داخل العناقيد وتعظيم الإختلافات بين العناقيد , بتحديد عدد ثابت من العناقيد وإختيار مراكز العناقيد الأولية عشوائياً , حيث يتم تجميع البيانات في k من العناقيد و تتم عملية العنقدة عن طريق التقليل من مجموع المسافات المربعة (المسافات الاقليدية) بين العناصر و مركز العنقود المقابل لها.

تهدف هذه الاطروحة الى دراسة وتحليل بيانات متعددة المتغيرات لامعلمية وتحتوي على قيم شاذة لمعرفة المتغيرات الاكثر تأثيرا على الظاهرة المدروسة باستخدام التحليل العاملي اللبي الحصين , ومن ثم المواءمة مع التحليل العنقودي اللبي لمعرفة اهم المتغيرات التي تؤثر على الظاهرة المدروسة ثم التعرف على مدى التقارب بين تلك المتغيرات في المرحلة اللاحقة اي ايجاد اسلوب لغرض تجميع المتغيرات المتشابهة , سيتم استعمال تحليل المركبات الرئيسة لتحديد العوامل المؤثرة ومن ثم تصنيفها بأستعمال اسلوب عنقدة  Kmeans , فعند استعمال بيانات ذات عدد متغيرات ومشاهدات كبير في التحليل العنقودي يؤدي الى تصنيف خاطئ للبيانات فضلا عن وقت اكبر للزمن لحساب النتائج.

وقد توصلت الدراسة الى مجموعة من الاستنتاجات اهمها:

  1. وجود القيم الشاذة يؤثر على نتائج تحليل المركبات الرئيسة المحسوبة بكافة الطرائق، فمن الواضح تقلص عدد المركبات المؤثرة وعدد المتغيرات المشمولة بالتاثير في كل مركبة من تلك المركبات المؤثرة، وإن هذا التأثير يقل بزيادة حجم العينة وزيادة عدد المتغيرات.
  2. ان التحليل العاملي اللبي الحصين اكثر كفاءة من التحليل العاملي اللبي والتحليل العاملي الاعتيادي في الحد من تأثير البيانات اللاخطية والقيم الشاذة على نتائج تحليل المركبات الرئيسة عند احجام العينات الصغيرة، فنسبة التباين المفسر كانت اكبر وبعدد أكبر من المركبات والمتغيرات المؤثرة، وإن ذلك يعود الى الية عمل طريقة (FHCS) الحصينة التي تعتمد على سحب عدد من العينات الجزئية ومن ثم إختيار القيم التي تقابل التباين الاقل ضمن مصفوفات التباين لتلك العينات الجزئية مما يؤدي الى تقليل تاثير القيم الشاذة في مصفوفة القيم المميزة .
  3. نسب التباين المفسر عند إستعمال الدوال اللبيةGaussian) ) و (Laplacian) ترتفع بزيادة حجم العينة وزيادة عدد المتغيرات لتقترب من تلك النسب عند إستعمال طريقة التحليل العاملي اللبي الحصين ، وهذا يشير الى تقارب نتائج التحليل العاملي اللبي الحصين والتحليل العاملي اللبي عند العينات المتوسطة ، في حين كانت نتائج التحليل العاملي اللبي أكثر دقة وكفاءة من نتائج التحليل العاملي اللبي الحصين عند أحجام العينات الكبيرة, وذلك بسبب تقلص تأثير البيانات اللاخطية والقيم الشاذة بازدياد حجم العينة ، وهذا يشير الى ان طريقة (FHCS) اللبية الحصينة تعمل بشكل أفضل كلما ازداد عدد القيم الشاذة .
  4. إن تحليل المركبات الرئيسة سواءا بإستعمال الطريقة الإعتيادية او الطريقة اللبية لا تعطي تحميلات مطابقة لنسب التباين المفسر رغم ان أداء الطريقة اللبية تحسن قليلا بالنسبة للتحميلات المستخرجة ، وهذا الحال ينطبق ايضا على طريقة (FHCS) اللبية الحصينة ولكن بنسبة أقل من الطريقتين السابقتين، وهذا يشير الى طرائق التحليل اللبي واللبي الحصين تركز على معالجة تاثير البيانات اللاخطية والقيم الشاذة على القيم المميزة مع تأثيرها على قيم التحميلات.

ومن خلال الاستنتاجات التي توصلت اليها الدراسة قدم الباحث عدد من التوصيات :

  1. استعمال المواءمة بين التحليل العاملي اللبي الحصين والتحليل العنقودي اللبي لمعرفة اهم المتغيرات المؤثرة على الظاهرة المدروسة ومن ثم معرفة ماهي المتغيرات الاقرب الى بعضها ذات التأثير المباشر على الظاهرة.
  2. اعتماد المواءمة مع التحليل العنقودي اللبي مقارنة مع المواءمة مع التحليل العنقودي الاعتيادية وبنسبة كبيرة بالاعتماد على نسبة التباين المفسر.
  3. اعتماد طريقة (FHCS) اللبية الحصينة كلما ازداد عدد القيم الشاذة.
  4. اعتماد التحليل العاملي اللبي الحصين في حالة البيانات اللاخطية والقيم الشاذة عند أحجام العينات الصغيرة والمتوسطة.
  5. اعتماد التحليل العاملي اللبي في حالة البيانات اللاخطية والقيم الشاذة عند أحجام العينات الكبيرة.

 

 

Comments are disabled.