ضریب همبستگی محصول پیرسون (R) یا ضریب همبستگی به مدت کوتاه ، اندازه گیری درجه رابطه خطی بین دو متغیر است که معمولاً دارای X و Y است. در حالی که در رگرسیون تأکید بر پیش بینی یک متغیر از دیگری است ، درهمبستگی تأکید بر درجه ای است که یک مدل خطی می تواند رابطه بین دو متغیر را توصیف کند. در رگرسیون علاقه جهت دار است ، یک متغیر پیش بینی می شود و دیگری پیش بینی کننده است. در همبستگی ، علاقه غیر جهت دار است ، رابطه جنبه اساسی است.
محاسبه ضریب همبستگی با کمک یک ماشین حساب آماری به راحتی انجام می شود. مقدار R در تخمین پارامترهای رگرسیون در فصل گذشته در یک ماشین حساب آماری یافت شد. اگرچه در این فصل فرمول های تعریف بعداً ارائه می شود ، خواننده تشویق می شود روش را برای به دست آوردن ضریب همبستگی در ماشین حساب در این زمان بررسی کند.
ضریب همبستگی ممکن است هر مقدار بین به علاوه و منهای یک را به خود اختصاص دهد.
نشانه ضریب همبستگی (+ ، -) جهت رابطه را مثبت یا منفی تعریف می کند. ضریب همبستگی مثبت به این معنی است که با افزایش مقدار یک متغیر ، مقدار متغیر دیگر افزایش می یابد. با کاهش دیگری کاهش می یابد. ضریب همبستگی منفی نشان می دهد که با افزایش یک متغیر ، دیگری کاهش می یابد و برعکس.
با در نظر گرفتن مقدار مطلق ضریب همبستگی ، قدرت رابطه را اندازه گیری می کند. ضریب همبستگی R = 0. 50 نشانگر درجه قوی تر رابطه خطی نسبت به یکی از R = 0. 40 است. به همین ترتیب ضریب همبستگی r =-50 میزان رابطه بیشتری نسبت به یکی از R = 0. 40 نشان می دهد. بنابراین ضریب همبستگی صفر (R = 0. 0) نشانگر عدم وجود رابطه خطی و ضرایب همبستگی R =+1. 0 و R = -1. 0 یک رابطه خطی کامل است.
درک و تفسیر ضریب همبستگی
ضریب همبستگی را می توان با روشهای مختلف درک کرد که اکنون هر یک از آنها به نوبه خود مورد بررسی قرار می گیرند.
پراکنده
پراکندگی های ارائه شده در زیر شاید به بهترین شکل ممکن نشان دهند که چگونه ضریب همبستگی با تغییر رابطه خطی بین دو متغیر تغییر می کند. هنگامی که r = 0. 0 نقاط به طور گسترده ای در مورد طرح پراکنده می شوند ، اکثریت تقریباً در شکل یک دایره می افتند. با افزایش رابطه خطی ، دایره تا زمانی که مورد محدود کننده (R = 1. 00 یا R = -1. 00) به شکل بیضوی تر و بیضوی تر شود و تمام نقاط در یک خط مستقیم قرار می گیرند.
تعدادی از پراکندگی ها و ضرایب همبستگی مرتبط با آنها در زیر ارائه شده است تا دانش آموز بتواند ارزش ضریب همبستگی را بر اساس یک پراکندگی در تمرین رایانه ای مرتبط تخمین بزند.
شیب خط رگرسیون Z-Scores
ضریب همبستگی شیب (B) خط رگرسیون است که هر دو متغیر X و Y به نمودارهای Z تبدیل شده اند. هرچه اندازه ضریب همبستگی بزرگتر باشد ، شیب تندتر است. این مربوط به تفاوت بین خط رگرسیون بصری و خط رگرسیون واقعی است که در بالا مورد بحث قرار گرفت.
این تفسیر از ضریب همبستگی شاید به بهترین شکل با نمونه ای از اعداد نشان داده شده باشد. مقادیر نمره خام متغیرهای X و Y در دو ستون اول جدول زیر ارائه شده است. دو ستون دوم ستون های X و Y هستند که با استفاده از تحول Z-نمره تبدیل می شوند.
یعنی میانگین از هر نمره خام در ستون های X و Y کم می شود و سپس نتیجه با انحراف استاندارد نمونه تقسیم می شود. جدول به شرح زیر است:
20. 60
34. 60
دو نکته با شماره های فوق وجود دارد: (1) ضریب همبستگی تحت تحول خطی x و/یا y ثابت است و (2) شیب خط رگرسیون هنگامی که هر دو x و y دگرگون شده اندضریب همبستگی به Z-Scores است.
محاسبه ضریب همبستگی ابتدا با نمرات خام X و Y بازده R = 0. 85. محاسبه بعدی ضریب همبستگی با z x و z y همان مقدار را به دست می آورد ، R = 0. 85. از آنجا که تحول Z یک مورد خاص از یک تحول خطی (x '= A + BX) است ، ممکن است ثابت شود که ضریب همبستگی با تغییر خطی از x و/یا y ثابت نیست (تغییر نمی کند)خواننده ممکن است این کار را با محاسبه ضریب همبستگی با استفاده از x و z y یا y و z x تأیید کند. این بدان معناست که این بدان معناست که تغییر مقیاس متغیر x یا y اندازه ضریب همبستگی را تغییر نمی دهد ، تا زمانی که تحول مطابق با الزامات یک تحول خطی باشد.
این واقعیت که ضریب همبستگی شیب خط رگرسیون است که هر دو x و y به Z-Scores تبدیل شده اند می توانند با محاسبه پارامترهای رگرسیون پیش بینی z x از z y یا z y از z x نشان داده شوند. در هر صورت ، رهگیری یا مؤلفه افزودنی خط رگرسیون (a) در خطای گرد صفر یا بسیار نزدیک خواهد بود. شیب (b) همان مقدار ضریب همبستگی خواهد بود ، دوباره در خطای گرد. این رابطه ممکن است به شرح زیر نشان داده شود:
تفسیر واریانس
ضریب همبستگی مربع (R 2) نسبت واریانس در y است که می تواند با دانستن X به حساب بیاید. برعکس ، این نسبت واریانس در X است که می تواند با دانستن Y حساب شود.
یکی از مهمترین خصوصیات واریانس این است که ممکن است در قسمتهای افزودنی جداگانه تقسیم شود. به عنوان مثال ، اندازه کفش را در نظر بگیرید. توزیع نظری اندازه کفش ممکن است به شرح زیر ارائه شود:
اگر نمرات موجود در این توزیع به دو گروه تقسیم شود ، یکی برای مردان و دیگری برای زنان ، توزیع ها می توانند به شرح زیر باشند:
اگر کسی جنس یک فرد را بشناسد ، در مورد اندازه کفش آن شخص چیزی می داند ، زیرا اندازه کفش نرها به طور متوسط تا حدودی بزرگتر از زنان است. واریانس در هر توزیع ، زن و مرد ، واریانس است که نمی تواند بر اساس رابطه جنسی یا واریانس خطا پیش بینی شود ، زیرا اگر کسی جنس یک فرد را بشناسد ، دقیقاً نمی داند اندازه کفش آن شخص چیست.
متغیر X به جای داشتن فقط دو سطح ، معمولاً سطوح زیادی خواهد داشت. استدلال قبلی ممکن است برای شامل این وضعیت گسترش یابد. می توان نشان داد که واریانس کل مجموع واریانس است که می تواند پیش بینی شود و واریانس خطا یا واریانس که نمی توان پیش بینی کرد. این رابطه در زیر خلاصه شده است:
ضریب همبستگی مربع برابر با نسبت پیش بینی شده به واریانس کل است:
این فرمول ممکن است از نظر واریانس خطا بازنویسی شود ، نه واریانس پیش بینی شده به شرح زیر:
واریانس خطا ، خطای S 2 ، با خطای استاندارد تخمین Squared ، S 2 Y. X ، که در فصل قبل مورد بحث قرار گرفته است ، تخمین زده می شود. واریانس کل (s2total) به سادگی واریانس y ، s 2 y است. فرمول اکنون می شود:
حل برای S y. x ، و اضافه کردن یک ضریب تصحیح (N-1)/(N-2) ، فرمول محاسباتی را برای خطای استاندارد تخمین به دست می آورد.
این رابطه اساسی بین ضریب همبستگی ، واریانس Y و خطای استاندارد تخمین را ضبط می کند. از آنجا که خطای استاندارد برآورد نسبت به واریانس کل بزرگ می شود ، ضریب همبستگی کوچکتر می شود. بنابراین ضریب همبستگی تابعی از خطای استاندارد تخمین و واریانس کل Y است. خطای استاندارد تخمین یک اندازه گیری مطلق از میزان خطا در پیش بینی است ، در حالی که ضریب همبستگی مربع یک اندازه گیری نسبی است ، نسبت بهواریانس کل
محاسبه ضریب همبستگی
ساده ترین روش محاسبه ضریب همبستگی استفاده از یک ماشین حساب آماری یا برنامه رایانه ای است. با توجه به این ، ضریب همبستگی ممکن است با استفاده از فرمول زیر محاسبه شود:
محاسبات با استفاده از این فرمول در زیر در برخی از داده های مثال نشان داده شده است: محاسبه به ندرت به این روش انجام می شود و به عنوان نمونه ای از کاربرد فرمول تعریف ارائه می شود ، اگرچه این فرمول بینش کمی از معنی ضریب همبستگی ارائه می دهد.
z x z y
ماتریس همبستگی
یک روش مناسب برای جمع بندی تعداد زیادی از ضرایب همبستگی این است که آنها را در یک جدول واحد قرار دهید ، به نام ماتریس همبستگی. یک ماتیکس همبستگی یک جدول از تمام ضرایب همبستگی ممکن بین مجموعه ای از متغیرها است. به عنوان مثال ، فرض کنید پرسشنامه ای از فرم زیر (Reed ، 1983) یک ماتریس داده را به شرح زیر تولید کرد.
سن - سن شما چقدر است؟_____
بدانید - تعداد پاسخ های صحیح از 10 ممکن برای یک مسابقه زمین شناسی که شامل قرار گرفتن صحیح 10 ایالت در نقشه ایالتی ایالات متحده بود.
بازدید - از چند ایالت بازدید کرده اید؟_____
comair - آیا تا به حال در یک هواپیمای تجاری پرواز کرده اید؟_____
رابطه جنسی - 1 = مرد ، 2 = زن
از آنجا که در پرسشنامه مثال پنج سؤال وجود دارد ، 5 * 5 = 25 ضرایب همبستگی ممکن است محاسبه شود. سپس هر همبستگی محاسبه شده در یک جدول با متغیرها به عنوان هر دو ردیف و ستون در تقاطع نام های متغیر ردیف و ستون قرار می گیرد. به عنوان مثال ، می توان همبستگی بین سن و دانش ، سن و وضعیت ، سن و سن ، سن و جنس ، دانش و وضعیت و غیره را محاسبه کرد و سپس در یک جدول از شکل زیر قرار گیرد.
با این حال ، نیازی به محاسبه تمام ضرایب همبستگی ممکن نیست ، زیرا همبستگی هر متغیر با خود لزوما 1. 00 است. بنابراین مورب های ماتریس نیازی به محاسبه ندارند. علاوه بر این ، ضریب همبستگی غیر جهت است. یعنی ، هیچ تفاوتی ایجاد نمی کند که آیا همبستگی بین سن و دانش با سن به عنوان x و دانش به عنوان y یا knowldege به عنوان x و سن محاسبه می شود. به همین دلیل ماتریس همبستگی متقارن در اطراف مورب است. در مورد مثال ، به جای 25 ضرایب همبستگی برای محاسبه ، فقط 10 مورد نیاز پیدا می شود ، 25 (کل) - 5 (مورب) - 10 (به دلیل تقارن) = 10 (ضرایب همبستگی منحصر به فرد).
برای محاسبه یک ماتریس همبستگی با استفاده از SPSS Select همبستگی و دو متغیره را به شرح زیر:
متغیرهایی را که باید در ماتریس همبستگی به شرح زیر گنجانده شود ، انتخاب کنید. در این حالت ، تمام متغیرها گنجانده می شوند و وسایل اختیاری و انحراف استاندارد تولید می شوند.
نتایج قبلی به شرح زیر است:
تفسیر تجزیه و تحلیل داده ها ممکن است به شرح زیر باشد. جدول میانگین و انحرافات استاندارد نشان می دهد که متوسط روانشناسی 121 دانش آموز که این پرسشنامه را پر کرده است حدود 19 سال قدمت داشت ، می توانست کمی بیش از شش ایالت از ده کشور را شناسایی کند و کمی از 18 از 50 ایالت بازدید کرده است. اکثریت (67 ٪) در یک هواپیمای تجاری پرواز کرده اند و کمتر از مردان زن (43 ٪) وجود دارد.
تجزیه و تحلیل ماتریس همبستگی نشان می دهد که معدودی از روابط مشاهده شده بسیار قوی بودند. قوی ترین رابطه بین تعداد ایالت های بازدید شده و اینکه آیا دانش آموز در یک هواپیمای تجاری پرواز کرده است یا نه (42/0 = r) که نشان می دهد اگر دانشجویی پرواز کرده بود ، احتمالاً بیشتر از ایالت های بیشتری بازدید کرده است. این به دلیل علامت مثبت در ضریب همبستگی و کدگذاری سوال هواپیمای تجاری (0 = خیر ، 1 = بله) است. همبستگی مثبت به این معنی است که با افزایش X ، Y نیز چنین می شود: بنابراین ، دانش آموزانی که پاسخ می دهند که در یک هواپیمای تجاری پرواز کرده اند ، به طور متوسط از کشورهای بیشتری بازدید می کنند.
سن با تعداد ایالت های بازدید شده (22/0 = r) و پرواز در یک هواپیمای تجاری (R = 0. 19) با دانشجویان مسن تر همبستگی مثبت داشت ، هر دو به احتمال زیاد از ایالت های بیشتر بازدید کرده اند و پرواز می کنند ، اگرچه این رابطه خیلی قوی نبود. هرچه تعداد ایالت های بازدید شده بیشتر باشد ، ممکن است دانش آموزان به طور صحیح بر روی نقشه شناسایی کنند ، اگرچه دوباره رابطه ضعیف بود (28/0 = r). توجه داشته باشید که یکی از دانش آموزانی که گفت وی از 48 ایالت از 50 ایالت بازدید کرده است ، می تواند تنها 5 از 10 را در نقشه مشخص کند.
سرانجام ، رابطه جنسی شرکت کننده با هر دو سن کمی ارتباط داشت ، (17/0 = r) نشان می دهد که زنان کمی بزرگتر از مردان بودند و تعداد ایالت های بازدید شده (R =-16) ، نشان می دهد که زنان از این موارد کمتر از مردان بازدید می کنندنتیجه گیری به دلیل علامت ضریب همبستگی و نحوه کدگذاری متغیر جنسی امکان پذیر است: 1 = مرد 2 = زن. هنگامی که همبستگی با رابطه جنسی مثبت باشد ، زنان بیشتر از هر آنچه در Y اندازه گیری می شود ، دارند. برعکس موردی است که همبستگی منفی است.
احتیاط در مورد تفسیر ضرایب همبستگی
نوع داده مناسب
تفسیر صحیح از ضریب همبستگی نیاز به این فرض دارد که هر دو متغیر ، x و y ، الزامات خاصیت بازه سیستم های اندازه گیری مربوطه را برآورده می کنند. ماشین حساب ها و رایانه ها بدون در نظر گرفتن اینکه اعداد به معنای اندازه گیری "معنی دار" هستند ، ضریب همبستگی ایجاد می کنند.
همانطور که در فصل مربوط به اندازه گیری بحث شده است ، خاصیت فاصله به ندرت ، اگر همیشه ، در برنامه های واقعی کاملاً راضی باشد. اختلاف نظر در مورد آمارشناسان در مورد زمان مناسب بودن فرضیه بازه زمانی وجود دارد. نظر شخصی من این است که تا زمانی که تعداد بیشتری به این معنی باشد که شیء بیشتر از چیزی یا دیگری برخوردار است ، پس استفاده از ضریب همبستگی مفید است ، اگرچه انحرافات بالقوه بیشتر از خاصیت بازه باید با احتیاط بیشتر تفسیر شود. هنگامی که داده ها با بیش از دو سطح به وضوح اسمی هستند (1 = پروتستان ، 2 = کاتولیک ، 3 = یهودی ، 4 = دیگر) ، کاربرد ضریب همبستگی به وضوح نامناسب است.
یک استثناء از قانون قبلی هنگامی اتفاق می افتد که مقیاس طبقه بندی اسمی دوگانگی باشد ، یا دارای دو سطح باشد (1 = مرد ، 2 = زن). ضرایب همبستگی محاسبه شده با داده های این نوع بر روی متغیر x و/یا y ممکن است با خیال راحت تفسیر شود زیرا فرض بر این است که خاصیت بازه برای این متغیرها برآورده می شود. ضرایب همبستگی محاسبه شده با استفاده از داده های این نوع ، گاهی اوقات نام های مختلف و مختلفی داده می شود ، اما از آنجا که به نظر می رسد آنها به درک معنای ضریب همبستگی کمی اضافه می کنند ، آنها ارائه نمی شوند.
تأثیر دور دور
یک امتیاز نهایی نمره ای است که در خارج از محدوده بقیه نمرات موجود در پراکندگی قرار دارد. به عنوان مثال ، اگر سن یک متغیر باشد و نمونه یک کلاس آمار باشد ، یک فرد بازنشسته یک فرد بازنشسته خواهد بود. بسته به جایی که دورتر سقوط می کند ، ممکن است ضریب همبستگی افزایش یابد یا کاهش یابد.
یک دور که در نزدیکی جایی قرار دارد که خط رگرسیون به طور معمول سقوط می کند ، لزوماً اندازه ضریب همبستگی را افزایش می دهد ، همانطور که در زیر مشاهده می شود.
یک دور از ذهن که از خط رگرسیون اصلی فاصله دارد ، اندازه ضریب همبستگی را کاهش می دهد ، همانطور که در زیر مشاهده می شود:
تأثیر دور از نمونه های فوق تا حدودی خاموش است زیرا اندازه نمونه نسبتاً بزرگ است (100 نفر). هرچه اندازه نمونه کوچکتر باشد ، اثر دورتر بیشتر می شود. در بعضی از مواقع ، بیش از حد تأثیر کمی در اندازه ضریب همبستگی نخواهد داشت.
هنگامی که یک محقق با یک فرد فراتر روبرو می شود ، باید تصمیمی اتخاذ شود که آیا آن را در مجموعه داده ها گنجانده باشد. ممکن است که پاسخ دهنده عمداً بدخلقی کند ، پاسخ های اشتباهی بدهد ، یا به سادگی سؤال پرسشنامه را درک نکرد. از طرف دیگر ، ممکن است که دورتر واقعی و به سادگی متفاوت باشد. تصمیم این که آیا شامل یک فرد دیگر در مورد محقق است یا نه ، شامل می شود. با این حال ، او باید حذف هرگونه داده برای خواننده گزارش فنی را توجیه کند. پیشنهاد می شود که ضریب همبستگی محاسبه شود و در صورت شک و تردید در مورد اینکه آیا این داده های واقعی است یا خیر ، هر دو با و بدون آن گزارش شود. در هر صورت ، بهترین راه برای کشف یک راه دور ، ترسیم پراکندگی است.
همبستگی و علیت
هیچ بحثی در مورد همبستگی بدون بحث در مورد علیت کامل نخواهد بود. این امکان وجود دارد که دو متغیر مرتبط باشند (همبستگی) ، اما یک متغیر دیگر وجود ندارد.
به عنوان مثال ، فرض کنید بین تعداد پاپسیکول های فروخته شده و تعداد مرگ و میر غرق در همبستگی بالایی وجود دارد. آیا این بدان معنی است که قبل از یک شنا نباید popsicles بخورد؟لازم نیست. هر دو متغیر فوق مربوط به یک متغیر مشترک ، گرمای روز هستند. هرچه درجه حرارت گرمتر باشد ، بیشتر فروخته می شود و همچنین افراد بیشتر شنا می کنند ، بنابراین مرگ و میر غرق تر می شود. این نمونه ای از همبستگی بدون علت است.
بخش عمده ای از شواهد اولیه مبنی بر اینکه سیگار کشیدن باعث ایجاد سرطان می شود. ممکن است افرادی که سیگار می کشند ، عصبی تر و عصبی تر هستند و مستعد ابتلا به سرطان هستند. همچنین ممکن است سیگار کشیدن در واقع باعث سرطان شود. شرکت های سیگار استدلال قبلی را مطرح کردند ، در حالی که برخی از پزشکان دومی را ساختند. در این مورد من معتقدم که این رابطه علیت است و بنابراین سیگار نمی کشید.
جامعه شناسان بسیار نگران مسئله همبستگی و علیت هستند زیرا بخش اعظم داده های آنها با همبستگی است. جامعه شناسان شاخه ای از تجزیه و تحلیل همبستگی ، به نام تجزیه و تحلیل مسیر را تهیه کرده اند ، دقیقاً برای تعیین علیت از همبستگی ها (Blalock ، 1971). قبل از اینکه همبستگی دلالت بر علیت داشته باشد ، باید الزامات خاصی برآورده شود. این الزامات عبارتند از: (1) متغیر علی باید به طور موقت پیش از متغیر ایجاد شده و (2) روابط خاصی بین متغیر علی و سایر متغیرها برآورده شود.
اگر همبستگی بالایی بین سن معلم و نمرات دانش آموزان پیدا شود ، لزوماً به این معنی نیست که معلمان مسن تر باتجربه تر هستند ، بهتر می آموزند و نمرات بالاتری می دهند. این لزوماً دلالت بر این ندارد که معلمان مسن لمس نرم هستند ، اهمیتی نمی دهند و نمرات بالاتری می دهند. برخی توضیحات دیگر نیز ممکن است نتایج را توضیح دهد. این همبستگی به این معنی است که معلمان مسن نمرات بالاتری می دهند. معلمان جوان نمرات پایین تری می دهند. این توضیح نمی دهد که چرا این مورد است.
خلاصه و نتیجه گیری
یک همبستگی ساده ممکن است از چند روش مختلف تفسیر شود: به عنوان یک اندازه گیری رابطه خطی ، به عنوان شیب خط رگرسیون Z-Scores ، و به عنوان ضریب همبستگی به عنوان نسبت واریانس با دانستن یکی از این موارد به حساب می آیدمتغیرهاتمام تفسیرهای فوق صحیح است و به معنای خاص به معنای یکسان است.
تعدادی از خصوصیاتی که ممکن است اندازه ضریب همبستگی را تأثیر بگذارد ، مشخص شد. آنها شامل بخش های مفقود شده از توزیع ، دور و متغیرهای مشترک بودند. سرانجام ، رابطه بین همبستگی و علیت مورد بحث قرار گرفت.
فارکس وکسب درامد...
ما را در سایت فارکس وکسب درامد دنبال می کنید
برچسب :
نویسنده : احمد قانع پور
بازدید : 25
تاريخ : پنجشنبه
19 مرداد
1402 ساعت: :