Download as pdf or txt
Download as pdf or txt
You are on page 1of 3

‫إعداد د‪ :‬محمود محمد الدريني‬ ‫مشكلة التعدد الخطي في االنحدار‬

‫مشكلة التعدد الخطي في االنحدار‬


‫‪Multicollinearity‬‬
‫‪ .1‬تعريف التعدد الخطي‪.‬‬
‫‪ .2‬عواقبه‪.‬‬
‫‪ .3‬اكتشاف‪.‬‬
‫‪ .4‬عالجه‪.‬‬
‫‪ .5‬تطبيق‬
‫‪ .1‬تعريف التعدد الخطي‬
‫يعرف التعدد الخطي بوجود عالقة خطية بين المتغيرات المستقلة ) ‪، ( X , X ,..., X‬‬
‫‪1‬‬ ‫‪2‬‬ ‫‪p‬‬

‫وهذا ينافي أحد االفتراضات التي يستند عليها نموذج االنحدار الخطي المتعدد‪ ،‬وهو‬
‫افتراض أن المتغيرات المستقلة يجب أن تكون مستقلة خطيا‪ ،‬أي ال توجد بينها عالقة‪.‬‬

‫‪ .2‬عواقب التعدد الخطي‬


‫وجود عالقة بين المتغيرات المستقلة يجعل األخطاء المعيارية لمعامال االنحدار‬
‫‪ S .E‬كبيرة حسب درجة االرتباط‪ ،‬ويترتب على ذلك احتماالت كبيرة في قبول الفرض‬ ‫ˆ‪‬‬

‫العدم ‪( H :   0‬المتغير المستقل ‪ X‬ليس له أثر معنوي) وقد يكون الفرض غير‬ ‫‪0‬‬

‫صحيح ومن ثم يقع الباحث في خطأ من النوع الثاني ‪.Error II‬‬

‫‪ .3‬اكتشاف التعدد الخطي‬


‫يمكن للباحث اكتشاف مشكلة التعدد الخطي من خالل عدة طرق منها ما‬
‫يلي‪:‬‬
‫‪ ‬عندما يكون معامل التحديد كبير ) ‪ ، ( R  0 . 7‬و من ثم كبر قيمة إحصائية‬
‫‪2‬‬

‫االختبار ) ‪ ( F  MSR / MSE‬مشيرة بصالحية النموذج الخطي للتنبؤ‪ ،‬وفي‬


‫*‬

‫الوقت نفسه يوجد متغير أو أكثر من المتغيرات المستقلة غير معنوي وفقا‬
‫الختبار ‪. t‬‬
‫‪ ‬البحث في معامالت االرتباط بين المتغيرات المستقلة ‪ r‬إذا كانت قوية‪،‬‬
‫‪xi , x‬‬ ‫‪j‬‬
‫إعداد د‪ :‬محمود محمد الدريني‬ ‫مشكلة التعدد الخطي في االنحدار‬

‫يشك في وجود ارتباط خطي بين المتغيرات المستقلة‪.‬‬

‫‪ ‬من خالل حساب قيمة محدد مصفوفة معامالت االرتباط بين المتغرات‬
‫المفسرة‪،‬‬
‫‪1‬‬ ‫‪rx‬‬ ‫‪rx‬‬ ‫‪...‬‬ ‫‪rx‬‬
‫‪1x2‬‬ ‫‪1x3‬‬ ‫‪1‬‬ ‫‪,x p‬‬

‫‪rx‬‬ ‫‪1‬‬ ‫‪rx‬‬ ‫‪...‬‬ ‫‪rx‬‬


‫‪1x2‬‬ ‫‪x3‬‬ ‫‪,x p‬‬
‫‪|‬‬
‫‪2‬‬ ‫‪2‬‬
‫‪|R‬‬ ‫‪xi , x‬‬ ‫‪j‬‬

‫‪rx‬‬ ‫‪x1‬‬
‫‪rx‬‬ ‫‪x2‬‬
‫‪rx‬‬ ‫‪x3‬‬
‫‪...‬‬ ‫‪1‬‬
‫‪p‬‬ ‫‪p‬‬ ‫‪p‬‬

‫‪ | R‬دل ذلك على وجود ارتباط خطي تام بين‬ ‫‪xi , x‬‬ ‫‪j‬‬
‫‪| 0‬‬ ‫إذا كان قيمة المحدد‬

‫‪ .4‬عالج مشكلة التعدد الخطي‬


‫يوجد عدد من طرق عالج التعدد الخطي بين المتغيرات المستقلة‪ ،‬منها ما يلي‪:‬‬

‫‪ -‬حذف بعض المتغيرات المستقلة من النموذج‪.‬‬


‫من خالل استخدام معامل تضخم التباين ]) ‪ [VIF  (1 /( 1  R‬لكل متغير مستقل ‪،‬‬ ‫‪X‬‬
‫‪2‬‬

‫حيث أن ‪ R‬هو معامل التحديد في نموذج انحدار المتغير المستقل ‪ X‬على باقي‬ ‫‪2‬‬
‫‪X‬‬

‫المتغيرات المستقلة‪ ،‬ويحسب هذا المعيار لكل متغير مستقل‪ .‬وعلى سبيل المثال إذا‬
‫كان عدد المتغيرات المستقلة أربعة هي‪ ( X , X , X , X ) :‬يكون لدينا أربع‬
‫‪1‬‬ ‫‪2‬‬ ‫‪3‬‬ ‫‪4‬‬

‫معادالت انحدار‪ ،‬هي‪:‬‬


‫‪equation‬‬ ‫‪1: X1  ‬‬ ‫‪0‬‬
‫‪2X‬‬ ‫‪2‬‬
‫‪ 3X‬‬ ‫‪3‬‬
‫‪4X‬‬ ‫‪4‬‬
‫‪ 1‬‬

‫‪equation‬‬ ‫‪2: X‬‬ ‫‪2‬‬


‫‪‬‬ ‫‪0‬‬
‫‪ 1X 1   3X‬‬ ‫‪3‬‬
‫‪4X‬‬ ‫‪4‬‬
‫‪ 2‬‬

‫‪equation‬‬ ‫‪3: X‬‬ ‫‪3‬‬


‫‪‬‬ ‫‪0‬‬
‫‪ 1X 1   2X‬‬ ‫‪2‬‬
‫‪4X‬‬ ‫‪4‬‬
‫‪ 3‬‬

‫‪equation‬‬ ‫‪4: X‬‬ ‫‪4‬‬


‫‪‬‬ ‫‪0‬‬
‫‪ 1X 1   2X‬‬ ‫‪2‬‬
‫‪ 3X‬‬ ‫‪3‬‬
‫‪ 4‬‬

‫ويحسب لكل معادلة معامل التحديد ‪ R‬ثم يحسب المعامل‬


‫‪2‬‬
‫‪X‬‬

‫]) ‪ ، [VIF  (1 /( 1  R‬إذا كان ‪ VIF‬يزيد عن ‪ 5‬يتم استبعاد المتغير المستقل‬ ‫‪X‬‬
‫‪2‬‬

‫المناظر لهذا المعيار‪.‬‬

‫‪ -‬معلومات اضافيه للعينة أو استعمال معلومات من خارج العينة‪.‬‬


‫كزيادة حجم العينة‪ ،‬أو توافر معلومات سابقة عن بعض معامالت االنحدار‪ ،‬يتم‬
‫االستناد إليها في التحليل‪.‬‬
‫إعداد د‪ :‬محمود محمد الدريني‬ ‫مشكلة التعدد الخطي في االنحدار‬

‫‪ -‬وضع المتغيرات في شكل نسب يعني قسمة النموذج على أحد المتغيرات المستقلة‪.‬‬
‫عندما يكون تباين الخطأ العشوائي متناسب مع أحد هذه المتغيرات ‪ ،‬يتم قسمة‬
‫المتغيرات المستقلة على هذا المتغير‪.‬‬

‫إضافة معلمة الـ ‪ Ridge‬وتطبيق طريقة المربعات الصغرى‬ ‫‪-‬‬


‫حيث يتم إضافة ثابت لمصفوفة التباين والتغاير ويتم الحصول على تقدير المربعات‬
‫الصغرى العادي‬

‫‪0  k 1‬‬

‫‪ 0  k‬معلمة التحيز‪ ،‬ويمكن التطبيق بسهولة في برنامج ‪.SPSS‬‬ ‫‪1‬‬

‫‪ .5‬تطبيق‬
‫فيما يلي بيانات عن اإلنفاق العائلي خالل الشهر كمتغير تابع ‪ ،‬والدخل وعدد أفراد األسرة‬
‫كمتغيرين مستقلين‪.‬‬
‫التطبيق في ملف ‪EXCEL‬‬

You might also like