Abstract
:In order to get at a model that leads to accurate predictions, it is necessary to search for the method of selecting the most important variables to be included in the model, especially when the data under study suffer from the problem of Co-Linearity , and the presence of many phenomena in our daily life, The main objective in this paper to compare among the methods of estimate unbiase parameters of the regression model ,OLS, Unbiase Ridge Regression and Lasso Regression and we consider MSE and P-Value as measures of comparison, a random sample of 100 women's fertility was withdrawn to study the factors affecting the number of children born as dependent variable and many independent random variables is (woman age , the age at married , graduate of woman , graduate of husband , women's weight, women's use of contraception, women's smoking, Age of Husband, job of husband, Marriage Period, Number of Dead Children, Hours of Exercise per Week, hours of female sleep per day, women taking drugs, duration of breast feeding, mother's job), data were suffering from a linear multiplicity problem, It was found that the Lasso regression method has the best estimation methods for owning the MSE, followed by the method of the unbiased ridge
Abstract
اللتوصل الى إنموذج له تنبؤات دقيقة , لابد من البحث عن الطريقة التي تقوم بمهمة اختيار المتغيرات الاكثر اهمية لتضمينها في الانموذج وخاصة عندما تكون البيانات تحت الدراسة تعاني من مشكلة التعدد الخطي , ولوجود كثير من الظواهر في حياتنا اليومية وخاصة الاجتماعية تعاني من هذه المشكلة , يهدف البحث للمقارنة بين طرائق تقدير معلمات انموذج الانحدار الخطي وهي (طريقة المربعات الصغرى,انحدار الحرف البيزي الغير متحيز, وانموذج انحدار لاسو )
وقد تم اعتماد متوسط مربعات الخطأ MSE والقيمة الاحتمالية P-Value كمعايير للمقارنة, تم سحب عينة عشوائية مؤلفة من (100) مفردة تخص خصوبة المرأة لدراسة العوامل المؤثرة على عدد الاطفال المولودين (متغير الاستجابة) , وعدة متغيرات مستقلة هي (عمر المراة , العمر عند الزواج , التحصيل الدراسي للمرأة , التحصيل الدراسي للزوج , وزن المرأة , استخدام المراة لوسائل منع الحمل , تدخين المرأة , عمر الزوج , مهنة الزوج, فترة الزواج , عدد الاطفال المتوفين , عدد ساعات ممارسة الرياضة في الاسبوع , اصابة المرأة بأمراض الغدة الدرقية , عدد ساعات نوم المرأة في اليوم ,
تناول الادوية من قبل المرأة , مدة الرضاعة الطبيعية , مهنة الام ) , وكانت البيانات تعاني من مشكلة تعدد خطي , وتم التوصل الى ان طريقة انحدار لاسو افضل من طريقة المربعات الصغرى وطريقة انحدار الحرف البيزية الغير متحيزة لامتلاكها اقل متوسط مربعات خطأ.
وقد تم اعتماد متوسط مربعات الخطأ MSE والقيمة الاحتمالية P-Value كمعايير للمقارنة, تم سحب عينة عشوائية مؤلفة من (100) مفردة تخص خصوبة المرأة لدراسة العوامل المؤثرة على عدد الاطفال المولودين (متغير الاستجابة) , وعدة متغيرات مستقلة هي (عمر المراة , العمر عند الزواج , التحصيل الدراسي للمرأة , التحصيل الدراسي للزوج , وزن المرأة , استخدام المراة لوسائل منع الحمل , تدخين المرأة , عمر الزوج , مهنة الزوج, فترة الزواج , عدد الاطفال المتوفين , عدد ساعات ممارسة الرياضة في الاسبوع , اصابة المرأة بأمراض الغدة الدرقية , عدد ساعات نوم المرأة في اليوم ,
تناول الادوية من قبل المرأة , مدة الرضاعة الطبيعية , مهنة الام ) , وكانت البيانات تعاني من مشكلة تعدد خطي , وتم التوصل الى ان طريقة انحدار لاسو افضل من طريقة المربعات الصغرى وطريقة انحدار الحرف البيزية الغير متحيزة لامتلاكها اقل متوسط مربعات خطأ.