پرداخت هزينه تحليل آماري با درگاه بانک ملت
  •   پرداخت هزينه تحليل آماري با درگاه بانک سامان
  • داراي تاييديه صلاحيت از مرکز آمار ايران مي باشيم. کليک نماييد
    logo-samandehi

ضرايب همبستگي در تحليل آماري


مقدمه:

در اين مقاله به بررسي موضوع ضريب همبستگي يا correlation coefficient که يکي از مفاهيم بنيادي در علم آمار است خواهيم پرداخت و به نقش آن در مدل سازي معادلات ساختاري اشاره خواهيم نمود.

1- انواع ضرایب همبستگی


سر فرانسیس گالتون همبستگی و رگرسیون را برای وارسی کواریانس در دو یا تعداد بیشتری از خصیصه ها مفهوم سازی کرد و کارل پیرسون (1896) براساس نظریه گالتون فرمول آماری برای ضریب همبستگی و رگرسیون ارائه داد(1986).به مدت کوتاهی پس از آن چارلز اسپیرمن(1904) روش همبستگی را برای روش تحلیل عاملی به کار برد. تکنیک های همبستگی ،رگرسیون و تحلیل عاملی برای دهه های متمادی پایه و اساس تهیه ی آزمون ها و تعریف سازه ها را شکل داده اند . .

ضریب همبستگی پیرسون پایه ای را برای ارائه و آزمون مدل ها در میان متغیرهای اندازه گیری شده و پنهان مهیا می کند. علاوه برآن همبستگی های تفکیکی و نیمه تفکیکی تعریف خاصی از روابط دو متغیره را بین متغیرها امکان پذیر می سازند که در آن واریانس صرفاً مشترک بین دو متغیر، در حالی که نفوذ سایر متغیرها کنترل شده است، تبیین می شود. همبستگی هایتفکیکی و نیمه تفکیکی نیز همچون ضریب همبستگی پیرسون می توانند مورد آزمون معناداری قرار گیرند.

در کنار ضریب همبستگی پیرسون که تأثیرات فراوانی بر علم آمار دارد سایر ضرایب همبستگی نیز بسته به سطح سنجش متغیرها معرفی شده اند.استیونز(1968) انواعی از مقیاس های اندازه گیری را معرفی کرده است که به عنوان مقیاس های اسمی، ترتیبی، فاصله ای و نسبی شناخته شده اند. انواع ضرایب همبستگی توسعه یافته برای این سطوح اندازه گیری در جدول زیر مشخص شده اند.

انواع ضريب همبستگی

در ادامه با توجه به نقش با اهمیتی که همبستگی(واریانس مشترک) در مدل سازی معادله ساختاری بازی می کند، عواملی را طرح می کنیم که بر ضرایب همبستگی اثر می گذارند.

2- عوامل موثر بر ضرایب همبستگی

عوامل اصلی در این رابطه عبارتند از: سطح اندازه گیری، محدودیت دامنه تغییرات مقادیر(تغییر پذیری، چولگی و کشیدگی)، داد های از دست رفته، غیر خطی بودن، مقادیر دورافتاده ، تصحیح تضعیف و موارد مرتبط با تغییر نمونه گیری، فاصله اطمینان، حجم اثر، معناداری و توان بیان شده در برآوردهای خودگردان.

1-2. سطح اندازه گیری و دامنه تغییرات مقادیر:

چهار نوع یا سطح اندازه گیری برای مقیاس های سنجش متغیرهای اسمی ، ترتیبی، فاصله ای و نسبی تعریف شده است (استیونز 1968).در مدل سازی معادله ساختاری هر یک از انواع چهارگانه ی مذکور را می توان در ساخت مدل مشارکت داد. مدل سازی معادله ساختاری به متغیرهای اندازه گیری شده در سطح فاصله ای یا نسبی نیاز داشته و لذا ضرایب همبستگی گشتاوری پیرسون دررگرسیون، تحلیل مسیر، تحلیل عاملی و مدل سازی معادله ساختاری مورد استفاده قرار می گیرد.همچنین لازم است که مقادیر متغیرهای فاصله ای و نسبی برای محاسبه واریانس دارای دامنه تغییرات به اندازه کافی بزرگ باشند.اگر دامنه تغییرات نمرات محدود باشد شدت همبستگی کاهش می یابد.

نکته ی دیگری که در مورد همبستگی بین مقادیر بایستی بدان اهمیت داده شود این است که اگر توزیع متغیرها به طور گسترده ای واگرا هستند، همبستگی می تواند تحت تأثیر قرار گیرد.برای جلوگیری از این موضوع تغییر شکل هایی مانند تبدیل ریشه دوم، تبدیل لگاریتمی، تبدبل معکوس و ...پیشنهاد می شود.

2-2. غیر خطی بودن :

ضریب همبستگی پیرسون نشان دهنده ی درجه رابطه خطی بین دو متغیر است.بنابراین ممکن است دو متغیری که دارای رابطه ی غیر خطی با یکدیگر هستند براساس این ضریب رابطه ای را نشان ندهند. در اینجا از ضریب اتا به عنوان شاخصی برای رابطه غیرخطی بین دو متغیر و با آزمون اثرات خطی ، درجه دوم و درجه سوم استفاده می شود.

3-2. داده های از دست رفته:

در یک ماتریس همبستگی با چندین متغیر، ضرایب همبستگی متفاوتی برای حجم نمونه های متفاوت می توانند محاسبه شوند.حذف انفرادی یا زوجی آزمودنی ها منجر به تفاوت در حجم نمونه برای ضرایب همبستگی موجود در ماتریس همبستگی می شود.

یک رویکرد مقدماتی در برخورد با داده های از دست رفته ، حذف هر مورد مشاهده شده ای است که دارای داده ی از دست رفته باشد. اما این روش توصیه نمی شود چراکه باعث از دست رفتن اطلاعات برای سایر متغیرها خواهد شد.روش دیگرحذف زوجی می باشد، این رویکرد داده ها را تنها هنگامی کنار می گذارد که آن ها برای دو متغیر از متغیرهای گزینش شده در تحلیل دارای داده از دست رفته باشند. سومین رویکرد که جایگزین کردن داده ها است، مقادیر از دست رفته را با یک برآورد جایگزین میکند. به عنوان مثال میانگین یک متغیر برای داده های موجود، با مقادیر از دست رفته برای کلیه موارد داده های فاقد داده همان متغیر جایگزین می شود.

4-2. مقادیر دور افتاده:

ضریب همبستگی پیرسون به طور قابل توجهی به وسیله ی یک داده ی دورافتاده منفرد چه برای X و چه برای Y تحت تأثیر قرار می گیرد. در پژوهش های بسیاری این موضوع به دقت مورد بررسی قرار گرفته است که چگونه داده های دور افتاده متفاوت برای x یا Y یا هردو روبط همبستگی را تحت تأثیر قرار می دهند و چگونه می توان با استفاده از آماره های استوارار به تحلیل بهتری دست یافت.

5-2. تصحیح تضعیف :

یک مفروضه ی اصلی در نظریه اندازه گیری این است که داده های مشاهده شده دارای خطای سنجش هستند. یک ضریب همبستگی پیرسون بسته به اینکه آیا آن ضریب با نمرات مشاهده شده (دارای خطا) یا نمرات واقعی(هنگامی که خطای سنجش را کنار گذاشته ایم) محاسبه شود مقادیر متفاوتی را نشان می دهد. ضریب همبستگی پیرسون می تواند برای خطاهای سنجش تضعیف کننده و ناپایدار در نمرات، تصحیح شده و به این ترتیب به یک مقدار واقعی از ضریب دست یابیم.در عین حال ضریب تصحیح شده می تواند مقداری بیش از 1 را نیز به خود بگیرد. پایین بودن قابلیت اعتماد در متغیرهای مستقل یا وابسته همراه با یک همبستگی بالا بین متغیر مستقل و وابسته می تواند ضریب همبستگی را به بالاتر از مقدار 1 برساند.

6-2. ماتریس های معین غیر مثبت:

ضرایب همبستگی بالاتر از مقدار1 در یک ماتریس همبستگی باعث معین و غیر مثبت شدن ماتریس همبستگی می شود.در اینصورت حل معادله مجاز نبوده و برآورد پارامترها قابل محاسبه نمی باشد.

ماتریس کواریانس معین غیر مثبت هنگامی رخ می دهد که دترمینان ماتریس صفر است و یا اینکه محاسبه معکوس ماتریس ممکن نیست. عواملی که چنین وضعیتی را بوجود می آورند عبارتند از ضریب همبستگی بزرگتر از 1، وابستگی خطی در میان متغیرهای مشاهده شده، همخطی در میان متغیرهای مشاهده شده، وجود وتغیری که ترکیب خطی از سایر متغیرها است، حجم نمونه کمتر از تعداد متغیرها، وجود واریانس صفر یا منفی، واریانس-کواریانس(همبستگی) خارج از دامنه تغییرات مجاز(∓1) و مقدار شروع کننده نامناسب در مدل هایی که توسط کاربر تعریف شده اند.

راه حل های ممکن برای حل چنین خطایی عبارتند از : کاهش میزان اشتراک یا تثبیت آن به مقدار کمتر از1، بیرون کشیدن تعدادی از عامل ها، تعریف مقیاس جدید برای متغیرهای مشاهده شده.

7-2. حجم نمونه :

در مدل سازی معادله ساختاری، محقق اغلب به حجم نمونه بسیار بزرگتری از حد معمول نیاز دارد تا با حفظ توان لازم به برآوردهای باثبات تری از پارامترها و خطاهای استاندارد دست یابد. همچنین بخشی از نیاز به حجم نمونه به وجود متغیرهای پنهان مربوط است. علاوه برمقادیر مختلفی که برای حجم نمونه پیشنهاد شده است، برخی از قاعده سرانگشتی به ازای هر متغیر 10 واحد نمونه یا به ازای هر متغیر 20 واحد نمونه استفاده کنند. با این حال باید توجه داشت که هرچه حجم نمونه بزرگتر باشد احتمالاً باعث می شود که فرد بتواند با استفاده از روش دو نیمه کردن به اعتبار بیشتری برای مدل ها دست یابد.


منبع: مقدمه ای بر مدل سازی معادله ساختاری ، انتشارات جامعه شناسان. نویسندگان : رندال ای ، شوماخر و ریچارد جی لومکس. ترجمه : دکتر وحید قاسمی.


براي مشاهده ساير مقاله هاي تحليل آماري اين وب سايت بر لينک زير کليک نماييد: صفحه مقاله هاي تحليل آماري


ساير منابع مرتبط با نکات تحليلي آماري :

در خصوص موضوعات مختلف تحليل آماري مي توانيد از مطالب وب سايت ديگر اين گروه نيز استفاده نماييد: مقاله و موضوعات تحليل آماري

مدل سازي معادلات ساختاري چيست؟

پژوهشگر گرامي، چنانچه مايليد در خصوص مدل سازي معادلات ساختاري بيشتر بدانيد، پيشنهاد مي شود به وب سايت ويژه مدل سازي معادله ساختاري با نرم افزار اسمارت پي ال اس (Smart Pls) مراجعه نماييد: مدل سازي معادلات ساختاري با نرم افزار اسمارت پي ال اس