کارا

آزمون مقایسه میانگین

سفارش تحلیل آماری

یکی از آزمون هایی که در تحلیل های آماری به کررات مورد نیاز واقع می شود، آزمون مقایسه میانگین یک یا چند جامعه است. به عنوان مثال فرض کنید که می خواهیم میزان فروش دو فروشگاه را با هم مقایسه کنیم یا اینکه میزان فروش یک فروشگاه را قبل از انجام تبلیغات و بعد از آن یا میزان بهبودی در وضعیت بیمار در قبل و بعد از مصرف یک دارو  یا میزان تاثیر دو داروی مختلف را بر روی یک بیماری مقایسه کنیم. همه این ها بخش کوچکی از اهدافی است که برای دستیابی به آن ها می توان از آزمون های مقایسه میانگین استفاده کرد. اما سوال اینجاست که چه وقت و چرا باید برای مقایسه میانگین ها از آزمون های آماری استفاده کرد؟ اگر دو فروشگاه داشته باشیم که یکی در یک روز خاص مثلاً ۱۰۰ واحد فروخته است و دیگری ۱۰۵ واحد، آیا نمی توان نتیجه گرفت که فروش فروشگاه دوم بیشتر است؟

آزمون های آماری مثل تمام تحلیل ها در آمار بر روی پدیده های تصادفی اعمال می شود. به عنوان مثال فرض کنید می خواهیم میزان فروش دو فروشگاه در اولین روز ماه قبل مقایسه کنیم. فروشگاه اول ۱۰۰ واحد فروش داشته و فروشگاه دوم ۱۰۵ واحد. در اینجا اگر بخواهیم میزان فروش در این دو فروشگاه در این روز خاص را مقایسه کنیم، میزان فروش برای فروشگاه دوم بیشتر از فروشگاه اول است. میزان فروش در فروشگاه ها در این روز خاص که قبلاً مشاهده شده تصادفی نیست و یک پدیده قطعی است. اما اگر فرض کنیم که میزان فروش در فروشگاه ها از یک قانون احتمالی پیروی می کند به عبارت دیگر یک پدیده تصادفی است (که در واقع همین طور هم است)، مثلاً در سه روز متوالی میزان فروش در فروشگاه اول ۱۰۱، ۹۸، ۱۱۰ باشد و در فروشگاه دوم ۱۰۲، ۹۵، ۱۱۱ باشد و در سه روز متوالی دیگر میزان فروش تغییر کند. وقتی در زمان های مختلف میزان فروش متفاوت باشد و به طور تصادفی تغییر کند و بخواهیم بدانیم که در دراز مدت میانگین فروش کدام فروشگاه بیشتر است، چه باید کرد؟ اختلاف میانگین فروش دو فروشگاه مثلاً در یک ماه باید چقدر باشد که نتیجه بگیریم میانگین (امید ریاضی) مربوط به قانون های احتمالی برای میزان فروش دو فروشگاه واقعاً با هم متفاوت است. آیا اختلاف در میانگین های مشاهده شده بخاطر اختلاف میانگین واقعی است یا بخاطر خطای تصادفی؟ بنابراین برای مقایسه میانگین پدیده های تصادفی، مقایسه میانگین ها به تنهایی معقول نیست و باید با استفاده از روش های آماری بررسی گردد که این اختلاف معنادار است یا خیر.

فرض کنیم می خواهیم تاثیر دو داروی مختلف را بر غلظت WBC خون افراد مقایسه کنیم. این شاخص، یک کمیت تصادفی است زیرا هر بار که یک فرد مورد آزمایش قرار می گیرد بسته به شرایط جسمی ممکن است میزان غلظت WBC مقدار متفاوتی باشد. فرض می کنیم که برای دو گروه ۱۰۰ نفره این شاخص اندازه گیری شده است و به یک گروه داروی اول و به گروه دیگر داروی دوم تجویز شود. حال می خواهیم بدانیم که تفاوت ایجاد شده در قبل و بعد از تجویز دارو در دو گروه موردنظر با هم تفاوت معنادار دارد یا خیر؟ قطعاً میزان تغییر در WBC دو گروه با هم متفاوت خواهد بود (ولو اندک) چه دارو موثر بوده و چه موثر نبوده باشد. حال سوال اینجاست که این اختلاف بخاطر شرایط پیش بینی نشده است (که اسمش را خطای تصادفی می گذاریم) یا بخاطر تاثیر داروهاست؟ میزان اختلاف چقدر باید باشد تا نتیجه گرفت که تاثیر داروها یکسان نیست؟ چه تضمینی وجود دارد که اگر چند بار آزمایش ها را تکرار کنیم هر بار نتیجه متفاوتی ایجاد نشود و هر بار یک دارو موثرتر تشخیص داده نشود؟ چگونه می توان با اطمینانی حداقل ۹۵ درصد به نتیجه آزمون اعتماد کرد؟ همه این سوالات منجر به ایجاد روش ها و آزمون ها در آمار شده است.

آزمون مقایسه میانگین را از چند جهت می توان تقسیم بندی کرد: تعداد جوامع مورد مقایسه (یک جامعه، دو جامعه، سه یا بیشتر) – وابسته یا مستقل بودن نمونه ها – پارامتری یا ناپارامتری بودن نوع آزمون- برقرار بودن یا نبودن همگونی واریانس ها در جوامع.

آزمون مقایسه میانگین یک جامعه

ساده ترین حالت آزمون های میانگین، آزمون مقایسه میانگین یک جامعه با یک مقدار ثابت است (ازمون میانگین تک نمونه ای). فرض کنید می خواهیم آزمون کنیم که آیا میانگین قد زنان ایرانی بیشتر از ۱۵۵ سانتیمتر است یا خیر؟ یا میزان WBC خون بیمارانی که تحت برخی مراقبت ها قرار می گیرند، کمتر از ۳۰۰۰۰ در میلی لیتر است یا خیر؟

آزمون نرمال

فرض کنیم که یک نمونه n تایی X_1, X_2, \dots, X_n از یک جامعه آماری انتخاب شده است. همچنین فرض می کنیم که داده ها از توزیع نرمال پیروی می کنند. اگر هدف این باشد که بخواهیم بررسی کنیم که میانگین توزیع داده ها برابر با مقداری مشخص (\mu_0) باشد یا خیر در اینصورت به فرض معلوم بودن واریانس جامعه از آزمون نرمال با آماره آزمون

    \[ Z=  \frac{ \bar{X}-\mu_0 }{\sigma / \sqrt{n}} \]

استفاده می شود که این آماره از توزیع نرمال پیروی می کند. n و \sigma انحراف معیار جامعه و \bar{X} میانگین نمونه ای است. این آماره از توزیع نرمال استاندارد پیروی می کند. بنابراین با توجه به نوع آزمون (یکطرفه بزرگتر، یکطرفه کوچکتر یا دو طرفه) مقداری آماره آزمون با مقدار بحرانی مقایسه می شود و میانگین جامعه مورد آزمون قرار می گیرد. همچنین می توان با مقایسه مقدار احتمال (p-value) و سطح معناداری در این مورد استنباط نمود (برای اطلاع از مفاهیم کلی آزمون ها نظیر نوع آزمون، مقدار احتمال، مقدار بحرانی و… به کتاب آمار و احتمال مقدماتی دکتر جواد بهبودیان رجوع کنید). پیشفرض این آزمون و تمام انواع آزمون های t استودنت، نرمال بودن توزیع داده هاست. بنابراین قبل از انجام آزمون باید نرمال بودن توزیع داده ها بررسی (بیشتر بخوانید) و در صورت عدم رد فرض نرمالیتی، از این آزمون استفاده کرد در غیر اینصورت از آزمون میانه ویلکاکسون باید استفاده نمود.

برای اجرای این آزمون با اسفاده از نرم افزار minitab از مسیر زیر می توان استفاده کرد:

آزمون تی minitab

در نرم افزار R نیز با استفاده از کدهایی مشابه کد زیر می توان این آزمون را انجام داد:

آزمون مقایسه میانگین - آزمون تی با R

آزمون تی تک نمونه ای

در بخش قبل آزمون نرمال جهت آزمودن مقایسه میانگین یک جامعه تک نمونه ای با توزیع نرمال و واریانس معلوم شرح داده شد. اما در اکثر موارد کاربردی، واریانس جامعه مورد بررسی معلوم نیست. در این حالت آزمون جایگزین، آزمون t استودنت تک نمونه ای است. آماره این آزمون به صورت زیر است:

    \[ T=  \frac{ \bar{X}-\mu_0 }{s/ \sqrt{n}} \]

که در آن s انحراف معیار نمونه ای داده های مشاهده شده است. توزیع این آماره آزمون، t استودنت با n-1 درجه آزادی است. به شرط نرمال بودن توزیع داده ها، در نرم افزار spss از مسیر زیر می توان این آزمون را اجرا نمود:

آزمون مقایسه میانگین - آزمون تی با spss

در نرم افزار minitab از مسیر

stat > Basic Statistics > 1 Sample T Test

می توان آزمون مقایسه میانگین تی تک نمونه ای را اجرا نمود. همچنین در نرم افزار R نیز از دستور t.test می توان این آزمون را اجرا کرد.

تحلیل آماری