معیار های پراکندگی


دید کلی:


علاوه بر تعیین مکان مرکز داده ها، جنبه مهمی از مطالعه توصیفی داده ها اندازه گیری عددی میزان پراکندگی داده ها حول مرکز است. دو مجموعه از داده ها ممکن است دارای مراکز یکسانی باشند ولی از نظر پراکندگی به اندازه قابل توجهی با هم متفاوت باشند.

محاسبه واریانس:


از آنجا که میانگین نمونه یک معیار گرایش به مرکز است، اختلاف داده ها نسبت به جرم بر حسب تفاضلهای ، ،...، نشان داده می شود، که هر یک از آنها را انحراف از میانگین، یا به عبارت ساده تر انحراف می نامند. به منظور یافتن شاخصی برای کل اختلافها، یک راه این است که متوسط این انحرافها را در نظر بگیریم.

متوسط انحرافها همیشه صفر است. این خاصیت از این امر ناشی می شود که بعضی انحرافها مثبت و انحرافهای دیگر منفی اند، و مجموع انحراف های مثبت دقیقا مجموع انحرافهای منفی را خنثی می کنند. بنابراین، در فرموله کردن یک معیار عددی برای پراکندگی، باید علامتهای منفی را قبل از متوسط گیری حذف کنیم؛ با مربع کردن یک عدد منفی، علامت مثبت می شود و به این ترتیب معیاری به نام واریانس نمونه بر مبنای متوسط گیری از انحراف های مربع شده ، ،...، ، به دست می آید. با توجه به این نکته که اگر مقدار n-1 انحراف (در بین n انحراف) معلوم باشد، خواد به خود انحراف باقیمانده معین می شود، زیرا مجموع n انحراف باید صفر گردد.

تعریف واریانس:

واریانس نمونه ای مرکب از n اندازه x1،...، xn به صورت زیر تعریف می شود:
مجموع مربعات انحراف هر xi از تقسیم بر n-1.

تعریف انحراف معیار:

برای یافتن یک معیار پراکندگی که واحد آن همان واحد داده ها باشد، از واریانس جذر مثبت گرفته، آن را انحراف معیار می نامیم. انحراف معیار به جای واریانس به عنوان یک معیار پایه ای برای پراکندگی به کار می رود. (s=√واریانس)
در مقایسه دو مجموعه داده ها با یکدیگر، بیشتر بودن مقدار s در یکی از این مجموعه ها، حاکی از یک مجموعه از داده ها نسبت به مجموع دیگر است.

دامنه نمونه:

معیار دیگری برای پراکندگی که گاهی اوقات به کار می رود، عبارت است از دامنه نمونه:

کوچکترین مشاهده- بزرگترین مشاهده = دامنه نمونه

دامنه را اغلب در مواقعی که حجم نمونه از 8 کوچکتر باشد به کار می برند.

دامنه میان چارکی:

برای حل مشکل استفاده از معیار دامنه نمونه که ممکن است بر اثر وجود یک یا دو مشاهده غیر معمول و دور از انتظار یک مقدار غیر معمولی را اختیار کند، اصلاحی به عمل می آید و فاصله بین چارکهای اول و سوم محاسبه می شود.

چارک اول- چارک سوم = دامنه میان چارکی نمونه

دامنه میان چارکی نمونه، طول فاصله ای را که نیمه مرکزی مشاهدات دربردارد، به دست می دهد. وجود تعداد کمی مشاهده خیلی بزرگ یا خیلی کوچک، در این معیار اثری نمی گذارد. امنروزه در گزارشهای دولتی راجع به درآمد و دیگر توزیعهایی که دارای دنباله کشیده در یک جهت هستند، دامنه میان چارکی نمونه، به عنوان یک معیار پراکندگی، بر واریانس رجحان داده می شود.

مباحث مرتبط با عنوان:


منابع


  • مفاهیم و روشهای آماری- جلد اول- تالیف: گوری ک. باتاچاریا- ریچارد ا. جانسون- ترجمه: مرتضی ابن شهرآشوب- فتاح میکائیلی- مرکز نشر دانشگاهی.
  • مقدمه ای بر نظریه آمار- الکساندر م. مود- فرانکلین آ. گریبیل- ترجمه: دکتر علی مشکانی- فتاح میکائیلی- دانشگاه فردوسی مشهد.


تعداد بازدید ها: 79111