کارا

تحلیل داده های رتبه بندی شده در R

داده های رتبه بندی شده:

گاهی در تفسیر داده ها ممکن است به داده هایی برخورد کنیم که جایگشت هایی از چند عدد، نماد، کالا یا هر چیز دیگری باشند، مثلاً در یک تحقیق از چند فروشنده پرسیده ایم که بیشترین میزان فروش از بین کالاهای A, B, C به ترتیب کدام کالاست. جواب های ممکن جایگشتی از این سه حرف است.

در نرم افزار R با استفاده از بسته pmr می توان داده های رتبه بندی شده را تحلیل کرد. تحلیل های توصیفی، مدل های احتمالی و تصمیم گیری چند معیاره بر روی این داده ها با استفاده از این بسته می توان انجام داد.

مثلاً فرض کنید جایگاه سه تیم فوتبال آرسنال، چلسی، لیورپول و منچستریونایتد در ۲۱ دوره گذشته لیگ جزیره، موضوع بررسی باشد. داده های به دست آمده به صورت زیر است:

> big4

 Ars Chels Liv Man n

    ۱     ۲      ۴   ۳        ۱

    ۱     ۴      ۲   ۳        ۱

    ۱     ۴      ۳   ۲         ۱

    ۲     ۱      ۴   ۳         ۱

    ۲     ۳      ۴   ۱         ۳

    ۲     ۴      ۳   ۱         ۴

    ۳     ۱      ۴   ۲         ۱

    ۳     ۲      ۴   ۱         ۳

    ۳     ۴      ۲   ۱         ۲

    ۴     ۱      ۳   ۲         ۱

    ۴     ۲      ۳   ۱         ۱

    ۴     ۳      ۲   ۱         ۲

در ماتریس فوق، سطرها جایشگت های ممکن برای رتبه های تیم ها (۴ تیم و ۱۲ جایگشت) و ستون ها رتبه در جایگشت و ستون آخر تعداد مشاهده شده از هر جایگشت آمده است. با دستور destat

می توان آماره های توصیفی خاص این داده ها را به دست آورد.

Descriptive statistics of ranking data:

$mean.rank: mean ranks; $pair: pairs; $mar: marginals

$mean.rank

[۱] ۲.۵۲۳۸۱۰ ۲.۸۵۷۱۴۳ ۳.۱۹۰۴۷۶ ۱.۴۲۸۵۷۱

$pair

[,۱] [,۲] [,۳] [,۴]

[۱,]    ۰   ۱۲   ۱۵    ۴

[۲,]    ۹    ۰   ۱۱    ۴

[۳,]    ۶   ۱۰    ۰    ۱

[۴,]   ۱۷   ۱۷   ۲۰    ۰

$mar

[,۱] [,۲] [,۳] [,۴]

[۱,]    ۳    ۸    ۶    ۴

[۲,]    ۳    ۵    ۵    ۸

[۳,]    ۰    ۵    ۷    ۹

[۴,]   ۱۵    ۳    ۳    ۰

خروجی این دستور شامل میانگین رنک هاست (میانگین مخصوص داده های رتبه بندی شده)، همچنین ماتریس مقایسه زوجی (pair) و ماتریس رتبه های حاشیه ای (mar) نیز گزارش شده است. ماتریس زوجی، تعداد مشاهداتی را نشان می دهد که در آن مورد اول (سطر) در جایگاه بهتری نسبت به مورد دوم (ستون) قرار گرفته است. قطر اصلی همواره صفر است چون هیچ موردی نمی توانسته بهتر از جایگاه خودش کسب کند. درایه سطر اول و ستون دوم برابر ۱۲ شده است بدین معناست که تیم اول (آرسنال)  در ۱۲ دوره مسابقات، جایگاهی بهتر از تیم دوم (چلسی) داشته است. (پرس سرور اس). در ماتریس دوم نیز تعداد مشاهداتی که در آن تیم i (سطر) در جایگاه jام (ستون) قرار می گیرد. مثلا درایه سطر اول و ستون اول تعداد قهرمانی تیم آرسنال یعنی ۳ بار در مشاهدات است.

همچنین با دستور rankplot می توان نموداری برای نمایش تعداد مشاهدات جایگشت های مختلف رسم نمود.