Rank sumtest (wilcoxon)

A.    Pengertian
Dalam statistik, uji Mann-Whitney U (juga disebut Mann-Whitney-Wilcoxon (MWW) atau Wilcoxon rank-sum) adalah sebuah tes hipotesis non-parametrik statistik untuk menilai apakah dua sampel independen dari pengamatan memiliki nilai sama besar. Ini adalah salah satu tes paling terkenal signifikansi non-parametrik. Ini awalnya diusulkan oleh Frank Wilcoxon tahun 1945, untuk ukuran sampel yang sama, dan diperluas dengan ukuran sampel sewenang-wenang dan dengan cara lain oleh Henry Mann dan muridnya Donald Ransom Whitney pada tahun 1947.
B.     Asumsi dan pernyataan resmi dari hipotesis
Meskipun Mann dan Whitney  dikembangkan uji MWW berdasarkan asumsi tanggapan terus-menerus dengan hipotesis alternatif adalah bahwa satu distribusi adalah stokastik lebih besar dari yang lain, ada banyak cara lain untuk merumuskan null dan hipotesis alternatif seperti bahwa uji MWW akan memberikan tes yang valid.
Sebuah formulasi yang sangat umum adalah dengan mengasumsikan bahwa:
1.      Semua pengamatan dari kedua kelompok yang independen satu sama lain,
2.      Respon adalah pengukuran ordinal atau kontinu (satu yaitu setidaknya bisa mengatakan, dari dua observasi, yang merupakan lebih besar),
3.      Berdasarkan hipotesis nol distribusi dari kedua kelompok adalah sama, sehingga probabilitas observasi dari satu populasi (X) melebihi sebuah pengamatan dari populasi kedua (Y) sama dengan probabilitas observasi dari Y melebihi pengamatan dari X, yang , ada sebuah simetri antara populasi berkenaan dengan probabilitas gambar acak dari sebuah pengamatan yang lebih besar.
4.      Berdasarkan hipotesis alternatif probabilitas observasi dari satu populasi (X) melebihi sebuah pengamatan dari populasi kedua (Y) (setelah mengoreksi hubungan) tidak sama dengan 0,5. Alternatif juga mungkin dinyatakan dalam istilah uji satu sisi, misalnya: P (X> Y) + 0,5 P (X = Y)> 0,5.
Jika kita tambahkan asumsi lebih ketat daripada yang di atas sedemikian rupa sehingga tanggapan dianggap kontinu dan alternatif adalah pergeseran lokasi (yaitu F1 (x) = F2 (x + δ)), maka kita dapat menginterpretasikan tes MWW signifikan menunjukkan yang signifikan perbedaan median. Berdasarkan asumsi pergeseran lokasi, kita juga bisa menafsirkan MWW sebagai menilai apakah estimasi Hodges-Lehmann dari perbedaan tendensi sentral antara dua populasi berbeda secara signifikan dari nol. Perkiraan Hodges-Lehmann untuk masalah dua sampel adalah median dari semua perbedaan yang mungkin antara observasi dalam sampel pertama dan observasi dalam sampel kedua.
C.     Perhitungan
Tes ini melibatkan perhitungan statistik, biasanya disebut U, yang distribusi bawah hipotesis nol diketahui. Dalam kasus sampel kecil, distribusi ditabulasikan, tetapi untuk ukuran contoh di atas ~ 20 ada pendekatan yang baik dengan menggunakan distribusi normal. Beberapa buku tabulasi statistik setara dengan U, seperti jumlah ranks di salah satu contoh, dari pada U sendiri.
Uji U termasuk dalam kebanyakan paket statistik modern. Hal ini juga mudah dihitung dengan tangan, terutama untuk sampel kecil. Ada dua cara untuk melakukan hal ini.
Pertama, mengatur semua pengamatan ke dalam seri peringkat tunggal. Artinya, peringkat semua pengamatan tanpa memperhatikan yang sampel mereka masuk
Untuk sampel kecil metode langsung dianjurkan. Hal ini sangat cepat, dan memberikan wawasan tentang arti dari statistik U.
1.      Pilih sampel yang barisan tampak lebih kecil (Satu-satunya alasan untuk melakukan ini adalah untuk membuat perhitungan lebih mudah). Panggilan ini "sampel 1," dan panggilan sampel lainnya "sampel 2."
2.      Mengambil pengamatan masing-masing dalam sampel 1, menghitung jumlah observasi dalam sampel 2 yang memiliki peringkat yang lebih kecil (jumlah setengah untuk setiap yang sama dengan itu). Jumlah hitungan ini adalah U.
Untuk sampel yang lebih besar, sebuah rumus dapat digunakan:
1.      Tambahkan menanjak untuk pengamatan yang berasal dari sampel 1. Jumlah peringkat pada sampel 2 berikut dengan perhitungan, karena jumlah dari semua peringkat sama N (N + 1) / 2 dimana N adalah jumlah total pengamatan.
2.      U kemudian diberikan oleh:
U_1=R_1 -  {n_1(n_1+1) \over 2}  \,\!
dimana n1 adalah ukuran sampel untuk sampel 1, dan R1 adalah jumlah peringkat pada sampel 1.
Perhatikan bahwa tidak ada spesifikasi yang ada sebagai sampel dianggap sampel 1. Sebuah rumus yang sama berlaku untuk U adalah
U_2=R_2 - {n_2(n_2+1) \over 2}. \,\!
 Nilai yang lebih kecil dari U1 dan U2 adalah satu digunakan ketika konsultasi tabel signifikansi. Jumlah dari dua nilai yang diberikan oleh
U_1 + U_2 = R_1 - {n_1(n_1+1) \over 2} + R_2 -
 {n_2(n_2+1) \over 2}. \,\!
 
Mengetahui bahwa R1 + R2 = N (N + 1) / 2 dan N = n1 + n2, dan melakukan beberapa aljabar, kita menemukan bahwa jumlah tersebut
U_1 + U_2 = n_1 n_2. \,\!

Nilai maksimum U adalah produk dari ukuran sampel untuk dua sampel. Dalam kasus seperti itu, "orang lain" U akan menjadi 0. U Mann-Whitney setara dengan luas area di bawah kurva karakteristik penerima operasi yang dapat dengan mudah dihitung
AUC_1 = {U_1 \over n_1n_2}
D.    Contoh
a.   Ilustrasi metode perhitungan
Misalkan Aesop tidak puas dengan eksperimen klasik di mana satu kura-kura ditemukan untuk mengalahkan satu kelinci dalam perlombaan, dan memutuskan untuk melaksanakan uji signifikansi untuk mengetahui apakah hasil bisa diperluas untuk kura-kura dan kelinci pada umumnya. Ia mengumpulkan contoh 6 kura-kura dan 6 kelinci, dan membuat mereka semua berjalan perlombaan sekaligus. Urutan di mana mereka mencapai posting finishing (urutan peringkat mereka, dari awal sampai akhir melewati garis finish) adalah sebagai berikut, menulis T untuk kura-kura dan H untuk kelinci:
T T H H H H H H T T T T
Berapa nilai U?
·            Dengan menggunakan metode langsung, masing-masing kita mengambil kura-kura pada gilirannya, dan menghitung jumlah kelinci itu dipukuli oleh, mendapatkan 0, 5, 5, 5, 5, 5, yang berarti U = 25. Atau, kita dapat mengambil setiap kelinci pada gilirannya, dan menghitung jumlah kura-kura itu dipukuli oleh. Dalam hal ini, kita mendapatkan 1, 1, 1, 1, 1, 6. Jadi U = 6 + 1 + 1 + 1 + 1 + 1 = 11. Perhatikan bahwa jumlah kedua nilai untuk U adalah 36, yang 6 × 6.
·             Menggunakan metode tidak langsung:
jumlah dari peringkat dicapai oleh kura-kura adalah 1 + 7 + 8 + 9 + 10 + 11 = 46.
Oleh karena itu U = 46 - (6 × 7) / 2 = 46-21 = 25.
jumlah dari peringkat dicapai oleh kelinci adalah 2 + 3 + 4 + 5 + 6 + 12 = 32, yang mengarah ke U = 32-21 = 11.
b.      Ilustrasi objek uji
Contoh kedua menggambarkan titik bahwa Mann-Whitney tidak menguji untuk persamaan median. Pertimbangkan ras lain kelinci dan kura-kura, dengan 19 peserta dari masing-masing spesies, di mana hasil adalah sebagai berikut:
HHHHHHHHHTTTTTTTTTTHH HHHHHHHHTTTTTTTTT
Kura-kura median di sini masuk di posisi 19, dan dengan demikian benar-benar mengalahkan kelinci median, yang masuk di posisi 20.
Namun, nilai U (untuk kelinci) adalah 100
(9 Hares dipukuli oleh (x) 0 kura-kura) + (10 hare dipukuli oleh (x) 10 kura-kura) = 0 + 100 = 100
Nilai U (untuk kura-kura) adalah 261
(10 kura-kura dipukuli oleh 9 hare) + (9 kura-kura dipukuli oleh 19 kelinci) = 90 + 171 = 261
Konsultasi tabel, atau menggunakan pendekatan di bawah ini, menunjukkan bahwa nilai ini U memberikan bukti signifikan bahwa kelinci cenderung melakukan lebih baik daripada kura-kura (p <0,05, dua-ekor). Jelas ini merupakan distribusi ekstrim yang akan terlihat mudah, tetapi dalam sesuatu sampel yang lebih besar serupa bisa terjadi tanpa itu begitu jelas. Perhatikan bahwa masalahnya di sini bukan bahwa dua distribusi peringkat memiliki variasi yang berbeda, mereka adalah bayangan cermin satu sama lain, sehingga varian mereka sama, tetapi mereka memiliki kemiringan yang sangat berbeda.
E.     Normal pendekatan
Untuk sampel besar, U adalah sekitar terdistribusi normal. Dalam hal ini, nilai standar
z = \frac{ U - m_U }{ \sigma_U }, \,
 
dimana mU dan σU adalah mean dan deviasi standar U, adalah kira-kira menyimpang normal standar yang signifikan dapat diperiksa pada tabel distribusi normal. mU dan σU diberikan oleh
m_U = \frac{n_1 n_2}{2}. \,
\sigma_U=\sqrt{n_1 n_2 (n_1 + n_2+1) \over 
12}. \,
 
 
Rumus untuk deviasi standar lebih rumit di hadapan jajaran terkait: rumus penuh diberikan dalam buku teks referensi di bawah ini. Namun, jika jumlah ikatan kecil (dan terutama jika tidak ada band dasi besar) hubungan dapat diabaikan saat perhitungan dilakukan oleh tangan. paket Komputer statistik akan menggunakan rumus disesuaikan dengan benar sebagai hal yang rutin.
Perhatikan bahwa sejak U1 + U2 = n1 n2, yang berarti n1 n2 / 2 yang digunakan dalam pendekatan normal adalah mean dari dua nilai U. Oleh karena itu, nilai absolut dari statistik z akan dihitung sama mana nilai U digunakan .
F.      Hubungan dengan tes lain
·         Perbandingan ke-uji t Student
Uji U berguna dalam situasi yang sama sebagai sampel independen t Student-test, dan muncul pertanyaan yang lebih disukai.
·         Ordinal data
U tetap menjadi pilihan logis ketika data ordinal namun tidak interval skala, sehingga jarak antara nilai-nilai yang berdekatan tidak bisa dianggap konstan.
·         Kesegaran
Seperti membandingkan jumlah peringkat,  uji Mann-Whitney kurang mungkin dibandingkan dengan t-test untuk palsu menunjukkan signifikansi karena kehadiran outlier -. Yaitu Mann-Whitney lebih kuat [klarifikasi diperlukan
G.    Efisiensi
Ketika normalitas memegang, MWW memiliki efisiensi (asimtotik) 3 / π atau sekitar 0,95 jika dibandingkan dengan uji t. Untuk distribusi cukup jauh dari normal dan untuk ukuran sampel yang cukup besar, maka MWW dapat juga lebih efisien daripada t.
Secara keseluruhan, ketangguhan membuat MWW berlaku lebih luas daripada uji t, dan untuk sampel besar dari distribusi normal, hilangnya efisiensi dibandingkan dengan uji t hanya 5%, sehingga seseorang dapat merekomendasikan MWW sebagai uji standar untuk membandingkan interval atau ordinal pengukuran dengan sebaran yang sama.
Hubungan antara efisiensi dan daya dalam situasi konkret tidak sepele sekalipun. Untuk ukuran sampel yang kecil orang harus menyelidiki kekuatan vs MWW t.
MWW akan memberikan hasil yang sangat mirip dengan melakukan tes parametrik biasa dua-sample t pada peringkat data.
H.    Distribusi yang berbeda-beda
Jika seseorang hanya tertarik pada stokastik pemesanan dari dua populasi (yaitu, konkordansi probabilitas P (Y> X)), uji Wilcoxon-Mann-Whitney dapat digunakan bahkan jika bentuk distribusi berbeda. Probabilitas konkordansi adalah persis sama dengan luas area di bawah kurva karakteristik penerima operasi (ROC) yang sering digunakan dalam konteks [rujukan?] Jika salah satu keinginan pergeseran interpretasi sederhana, uji U tidak boleh digunakan. Saat distribusi dari dua sampel yang sangat berbeda, karena dapat memberikan hasil yang keliru signifikan.
I.        Alternatif
Dalam situasi itu, versi varians yang tidak merata uji t cenderung memberikan hasil yang lebih dapat diandalkan, tetapi hanya jika normalitas memegang.
Atau, beberapa penulis (misalnya Conover) mengusulkan mengubah data ke peringkat (jika mereka tidak sudah peringkat) dan kemudian melakukan uji t pada data berubah, versi uji t digunakan tergantung pada apakah atau tidak varians populasi yang diduga untuk berbeda. Rank transformasi tidak melestarikan variasi sehingga sulit untuk melihat bagaimana hal ini akan membantu.
Uji Brown-Forsythe telah diusulkan sebagai setara non-parametrik sesuai dengan uji F untuk varian yang sama.
J.       τ Kendall's
Uji U berkaitan dengan sejumlah prosedur lainnya statistik non-parametrik. Sebagai contoh, adalah setara dengan korelasi τ Kendall's koefisien jika salah satu variabel adalah biner (yaitu, hanya bisa mengambil dua nilai).
K.    statistik ρ
statistik yang disebut ρ yang berhubungan linier terhadap U dan banyak digunakan dalam studi kategorisasi (konsep diskriminasi melibatkan pembelajaran) dihitung dengan membagi U dengan nilai maksimum untuk ukuran sampel yang diberikan, yang hanya n1 × n2. ρ demikian ukuran non-parametrik dari tumpang tindih antara dua distribusi, yang dapat mengambil nilai antara 0 dan 1, dan merupakan perkiraan P (Y> X) + 0.5 P (Y = X), dimana X dan Y pengamatan dipilih secara acak dari dua distribusi. Kedua nilai-nilai ekstrim merupakan pemisahan lengkap distribusi, sementara ρ sebesar 0,5 merupakan lengkap tumpang tindih. Statistik ini pertama kali diusulkan oleh Richard Herrnstein (lihat Herrnstein dkk, 1976.). Kegunaan dari statistik ρ dapat dilihat dalam kasus contoh aneh yang digunakan di atas, di mana dua distribusi yang berbeda nyata pada tes-U tetap memiliki median hampir identik: nilai ρ dalam hal ini adalah sekitar 0,723 berpihak pada kelinci, benar mencerminkan fakta bahwa meskipun median kura-kura mengalahkan kelinci median, yang kelinci kolektif itu lebih baik daripada kura-kura darat secara kolektif.
L.     Contoh laporan hasil
Dalam melaporkan hasil dari uji Mann-Whitney, adalah penting bagi negara:
·         Ukuran kecenderungan sentral dari dua kelompok (berarti atau median; sejak Mann-Whitney tes ordinal, median biasanya dianjurkan
·          Nilai U
·         Ukuran sampel
·         Tingkat signifikansi.
Dalam prakteknya beberapa informasi ini mungkin sudah disertakan dan akal sehat harus digunakan dalam memutuskan apakah akan mengulanginya. Sebuah laporan khas mungkin lari,
"Latency Median dalam kelompok E dan C adalah 153 dan 247 ms;. Distribusi dalam dua kelompok berbeda bermakna (Mann-Whitney U = 10,5, n1 = n2 = 8, P <0,05 dua sisi)".
Sebuah pernyataan yang tidak keadilan penuh dengan status statistik uji mungkin lari,
"Hasil dari dua perlakuan dibandingkan dengan menggunakan Wilcoxon-Mann-Whitney dua sampel uji rank-sum. Pengaruh perlakuan (perbedaan antara perlakuan) telah dihitung dengan menggunakan Hodges-Lehmann (HL) estimator, yang konsisten dengan uji Wilcoxon (Ref. 5 di bawah). ini estimator (HLΔ) adalah median dari semua kemungkinan perbedaan hasil antara subjek dalam kelompok B dan topik di grup A. A 0,95 non-parametrik interval kepercayaan untuk HLΔ menyertai estimasi tersebut tidak ρ, perkiraan probabilitas bahwa subjek yang dipilih secara acak dari populasi B memiliki berat yang lebih tinggi daripada subjek yang dipilih secara acak dari populasi A. [kuartil] median berat untuk mata pelajaran pada perlakuan A dan B masing-masing adalah 147 [121, 177] dan 151 [ 130, 180] Kg Perlakuan A. turun berat badan dengan HLΔ = 5 Kg (0,95 CL [2, 9] Kg, 2P = 0,02., ρ = 0,58).. "
Namun akan jarang ditemukan sehingga diperpanjang laporan dalam dokumen yang besar topik tidak inferensi statistik.
M. Implementasi
·         Online implementasi menggunakan javascript
·         ALGLIB mencakup pelaksanaan uji U Mann-Whitney di C + +, C #, Delphi, Visual Basic, dll
·          R mencakup pelaksanaan uji (ada disebut sebagai uji dua sampel Wilcoxon) sebagai wilcox.test (dan dalam kasus hubungan dalam sampel: wilcox.exact dalam paket exactRankTests, atau gunakan option = tepat FALSE) .
·         Stata mencakup pelaksanaan uji rank-sum Wilcoxon-Mann-Whitney dengan perintah ranksum.
·         SciPy memiliki fungsi mannwhitneyu dalam modul statistik.
·         MATLAB menerapkan uji dengan ranksum fungsi dalam toolbox statistic

1 komentar:

  1. Soal-soal dan penyelesaiannya ini dapat membantu untuk mempelajari statistik non parametrik.

    BalasHapus