آزمون های آماری ناپارامتریک

فهرست مطالب
Toggleچکیده
آزمونهای ناپارامتریک من ویتنی و ویلکاکسون بهعنوان جایگزینهای قدرتمند برای آزمونهای پارامتریک، زمانی کاربرد دارند که دادهها شرایط نرمال را ندارند یا حجم نمونه کوچک است. آزمون من ویتنی برای مقایسه دو گروه مستقل و آزمون ویلکاکسون برای دادههای وابسته یا جفتشده به کار میروند. این آزمونها بر اساس رتبهبندی دادهها عمل میکنند و برای دادههای ترتیبی یا دارای توزیع نامشخص بسیار مناسب هستند. هدف این مقاله بررسی کاربرد، فرضیات، نحوه اجرا و اهمیت این آزمونها در تحلیلهای آماری است.
مقدمه
در مطالعات علمی و پزشکی، مقایسه گروهها و ارزیابی اثرات درمان یا مداخله، نیازمند استفاده از آزمونهای آماری مناسب است. آزمونهای پارامتریک مانند t تست، فرض توزیع نرمال دادهها را دارند که در برخی شرایط عملی قابل تحقق نیست. دادههایی با توزیع نامشخص یا دادههای ترتیبی (مانند رتبهبندی رضایت بیمار یا شدت درد) نیازمند آزمونهای ناپارامتریک هستند. دو آزمون مشهور در این حوزه، آزمون من ویتنی (Mann-Whitney U Test) و آزمون ویلکاکسون (Wilcoxon Signed-Rank Test) هستند که هرکدام برای شرایط خاصی طراحی شدهاند.
روشها
آزمون من ویتنی (Mann-Whitney U Test):
این آزمون برای مقایسه دو گروه مستقل استفاده میشود. فرض کنید میخواهیم اثر دو داروی مختلف را روی فشار خون بررسی کنیم، اما دادههای فشار خون توزیع نرمال ندارند. در این حالت، دادههای هر گروه با هم ترکیب و رتبه داده میشوند. سپس مجموع رتبهها برای هر گروه محاسبه میشود و با آمار U، تفاوت بین دو گروه ارزیابی میگردد.
نحوه انجام آزمون من ویتنی:
• ترکیب دادههای دو گروه و رتبهبندی آنها.
• محاسبه مجموع رتبهها برای هر گروه.
• محاسبه آماره U با استفاده از فرمول:
U = n1 * n2 + (n1 * (n1 + 1)) / 2 – R1
که در آن n1 و n2 اندازه نمونهها و R1 مجموع رتبههای گروه اول است.
• مقایسه U با مقدار بحرانی از جدول یا محاسبه p-value.
مثال : فرض کنید دو گروه بیمار تحت درمان با دو داروی متفاوت هستند (گروه اول: ۸ نفر، گروه دوم: ۷ نفر) پس از رتبهبندی دادهها و محاسبه آماره U، اگر U از مقدار بحرانی کمتر باشد، نتیجه میگیریم که تفاوت معنادار وجود دارد.
مثال عددی برای آزمون من ویتنی (Mann-Whitney U Test)
فرض کنید سطح TSH دو گروه مستقل از بیماران(گروه کنترل و گروه دریافتکننده دارو) اندازهگیری شده است. هدف، مقایسه توزیع TSH بین دو گروه است. دادهها به صورت زیر هستند:
ردیف | TSH | گروه | رتبه |
1 | 1.8 | دارو | 1 |
2 | 1.9 | کنترل | 2 |
3 | 2.0 | دارو | 3 |
4 | 2.2 | کنترل | 4 |
5 | 2.3 | دارو | 5 |
6 | 2.5 | کنترل | 6 |
7 | 2.6 | دارو | 7 |
8 | 2.8 | کنترل | 8 |
9 | 2.9 | دارو | 9 |
10 | 3.0 | کنترل | 10 |
در این مثال، مجموع رتبههای گروه دارو برابر است با: 1 + 3 + 5 + 7 + 9 = 25. آماره U برای هر گروه محاسبه شده و با مقدار بحرانی جدول مقایسه یا p-value محاسبه میشود.
آزمون ویلکاکسون (Wilcoxon Signed-Rank Test):
آزمون ویلکاکسون رتبه علامت دار به منظور انجام بررسی دو نمونه وابسته یا انطباق بین دو نمونه به کار گرفته می شود.این آزمون را می توان مشابه آزمون tبرای گروه های وابسته برای میانگبن جامعه غیر نرمال ، در نظر گرفت.هر چند این آزمون، ماپارامتری بوده و به توزیع داده ها بستگی ندارد، ولی برای انجام ای آزمون باید فرضیات زیر بررسی شده باشند.
داده ها باید به صورت زوجی و از یک جامعه گرفته شده باشند.
هر مولفه از زوج ها به صورت تصادفی انتخاب شده و مستقل از نمونه دیگر باشند.
نوع یا مقیاس داده ها باید به صورت فاصله ای یا نسبتی باشند تا بتوان تفاوت بین مقدار آن ها ر ا به دست آورد و این تفاضل ها را رتبه بندی کرد. به این ترتیب باید مطمئن شد که تفاضل مقدار زوج ها به صورت مقیاس ترتیبی باشند.
نحوه انجام آزمون ویلکاکسون:
- قدر مطلق تفاضل زوج ها برای همه زوج ها محاسبه شود.
- زوج هایی که اختلاف آن ها صفر است از آزمون حذف می شوند.
- به هر یک از زوج ها بر اساس اندازه نسبی قدر مطلق تفاضل آن ها رتبه 1 تا n اختصاص داده می شود. رتبه 1 به زوج با کوچک ترین اختلاف ها تخصیص داده می شود، رتبه 2 به زوجی تخصیص داده می شود که دارای دومین کوچک ترین اختلاف ها باشد و به همین ترتیب ادامه می یابد تا رتبه n به زوجی تخصیص می یابد که دارای بزرگ ترین اختلاف ها باشد.
- اگر چندین زوج دارای اختلاف یکسان باشند و نتوان تعیین کرد که کدام رتبه به کدام اختلاف باید اختصاص داده شود میانگین رتبه ها به همه آن ها اختصاص داده می شود.به طور مثال اگر رتبه های 3،4،5،6 به چهار زوج تعلق گیرد،اما به دلیل اینکه چهار قدر مطلق تفاضل مربوط به آن زوج ها دقیقا با یکدیگر مساوی باشند آنگاه به هر زوج میانگین رتبه ها یعنی3+4+5+6=5/4 اختصاص داده می شود.
- در نهایت جمع مقادیر عدد رتبه متناظر با اختلاف منفی و اختلاف مثبت به صورت جداگانه محاسبه می شود.
- عدد کوچک تر جمع متناظر ها(مثبت یا منفی) به عنوان شاخص آزمون در نظر گرفته می شود
- با توجه به تعداد زوج های آزمون (n) از جدول مخصوص آماره ویلکاکسون عدد بحرانی استخراج می شود.
- مقدار کوچک ترین عدد جمع متناظر ها با عدد بحرانی جدول مقایسه می شود.
اگر عدد نهایی ( جمع متناظرهای مثبت و یا منفی) از عدد بحرانی جدول( با ضریب اطمینان مورد نظر) کوچک تر باشد فرض صفر آزمون (برابر بودن دو سری داده) رد می شود. در غیر این صورت برابر بودن دو سری در آزمون تایید می شود.
اجرای آزمون ویلکاکسون با استفاده از صفحه گسترده اکسل برای آزمایش TSH
B | C | D | E | F | G | H | |
TSH1 | TSH2 | اختلاف | مثبت/منفی | قدر مطلق اختلاف | رتبه | رتبه علامت دار | |
1 | 18.30 | 12.70 | 5.60 | 1 | 5.60 | 8.0 | 8 |
2 | 13.30 | 11.10 | 2.20 | 1 | 2.20 | 5.0 | 5 |
3 | 16.50 | 15.30 | 1.20 | 1 | 1.20 | 3.0 | 3 |
4 | 12.60 | 12.70 | 0.10- | 1- | 0.10 | 1.0 | 1- |
5 | 9.50 | 10.50 | 1.000- | 1- | 1.00 | 2.0 | 2- |
6 | 13.60 | 15.60 | 2.00- | 1- | 2.00 | 4.0 | 4- |
7 | 8.10 | 11.20 | 3.10- | 1- | 3.10 | 6.0 | 6- |
8 | 8.90 | 14.20 | 5.30- | 1- | 5.30 | 7.0 | 7- |
9 | 10.00 | 16.20 | 6.20- | 1- | 6.20 | 9.0 | 9- |
10 | 8.30 | 15.50 | 7.20- | 1- | 7.20 | 10.0 | 10- |
11 | 7.29 | 19.90 | 12.00- | 1- | 12.00 | 11.0 | 11- |
12 | 8.10 | 20.40 | 12.30- | 1- | 12.30 | 12.0 | 12- |
13 | 13.4 | 36.0 | 23.40- | 1- | 23.40 | 13.0 | 13- |
=ABS(SUMIF(H2:H14,”>0”,H2:H14)) | 16 | W+ | جمع رتبه مثبت ها |
=ABS(SUMIF(H2:H14,”< 0”,H2:H14)) | 75 | w- | جمع رتبه منفی ها |
=ABS(MIN(C16:C17)) | 16 | Test Statatistic | |
17 | Critical value | ||
=IF(C18<C19,”reject”,”Accept”) | رد می شود | تفسیر | |
کوچک ترین جمع متناظر کمتر از عدد بحرانی است |
جدول مقایسهای آزمونها
آزمون من ویتنی (Mann-Whitney U Test) | آزمون ویلکاکسون (Wilcoxon Signed-Rank Test) | ویژگی ها |
مقایسه دو گروه مستقل | مقایسه دادههای جفتشده یا وابسته (قبل و بعد) | هدف آزمون |
دادههای ترتیبی، ناپارامتریک یا دادههای با توزیع نامشخص | دادههای ترتیبی، ناپارامتریک یا دادههای با توزیع نامشخص | نوع دادهها |
مستقل | (وابسته) جفتشده | نوع نمونهها |
استقلال گروهها دادهها حداقل رتبهای باشند |
دادهها جفتشده و وابسته اختلافها توزیع متقارن داشته باشند |
فرضیات اصلی |
رتبهبندی کل دادهها و مقایسه مجموع رتبهها در دو گروه | رتبهبندی اختلافات جفتها و مقایسه مجموع رتبههای مثبت و منفی | مبنای آزمون |
بدون نیاز به نرمال بودن دادهها | بدون نیاز به نرمال بودن دادهها | حساسیت به توزیع داده |
کوچک تا متوسط | کوچک تا متوسط | حجم نمونه مناسب |
مقایسه بین دو گروه مستقل (مثلاً گروه درمان و کنترل) | مقایسه قبل و بعد درمان روی یک گروه | کاربرد رایج |
اثر دو داروی متفاوت بر دو گروه بیمار مستقل | تغییر فشار خون قبل و بعد از درمان در همان گروه بیماران | مثال کاربردی |
آماره U و مقدار p | آماره W و مقدار p | خروجی اصلی آزمون |
نیازمند دادههای مستقل | نیازمند دادههای جفتشده و توزیع اختلاف متقارن | محدودیتها |
دادههای وابسته یا جفتشده | دادههای مستقل | نوع دادههای نامناسب |
نتایج
مطالعات مختلف نشان دادهاند که این دو آزمون در شرایط عدم نرمال بودن دادهها عملکرد مناسبی دارند و نسبت به آزمونهای پارامتریک از انعطاف بیشتری برخوردارند. همچنین، این آزمونها در علوم پزشکی، روانشناسی و علوم اجتماعی کاربرد فراوان دارند و تحلیل دقیقتر دادهها را بدون نیاز به فرض نرمال بودن فراهم میکنند.
بحث و نتیجهگیری
آزمونهای من ویتنی و ویلکاکسون ابزارهای کلیدی در تحلیل دادههای ناپارامتریک محسوب میشوند. انتخاب آزمون مناسب بسته به نوع دادهها (مستقل یا وابسته بودن نمونهها) اهمیت زیادی دارد. این آزمونها تحلیل دادههایی را که در آنها فرضیات آزمونهای پارامتریک برقرار نیست، به روشی علمی و قابل اعتماد امکانپذیر میسازند. به همین دلیل، در مطالعاتی که دادهها شرایط ایدهآل ندارند یا دادهها ترتیبی هستند، استفاده از این آزمونها توصیه میشود.
منابع
جلد چهارم سری کتاب های تضمین کیفیت در آزمایشگاه ( صحه گذاری و تایید روش ها) با تالیف دکتر جباری
McKnight PE, Najab J. Mann-Whitney U Test. In: The Corsini Encyclopedia of Psychology. 2010.
Wilcoxon F. Individual Comparisons by Ranking Methods. Biometrics Bulletin. 1945;1(6):80-83.
3Fay MP, Proschan MA. Wilcoxon–Mann–Whitney or t-test? Statistics Surveys. 2010;4:1-
دیدگاهتان را بنویسید