rank Correlation test (spearman)


Spearman
Sebuah Spearman korelasi 1 hasil ketika dua variabel yang dibandingkan adalah monoton istimewa, bahkan jika hubungan mereka tidak linear. Sebaliknya, ini tidak memberikan korelasi Pearson sempurna
Sebuah korelasi Spearman 1 Hasil variabel dibandingkan ketika berdoa adalah Pihak yang monoton yang, bahkan jika mereka sales regular tidak linier. Sebaliknya, Suami regular tidak memberikan korelasi Pearson Sempurna


Korelasi Spearman kurang sensitif dibandingkan dengan korelasi Pearson terhadap outlier kuat yang berada di ekor dari kedua sampel.
Dalam statistik, korelasi peringkat Spearman's rho koefisien atau Spearman, yaitu setelah Charles Spearman dan sering ditandai oleh huruf Yunani ρ (rho) atau sebagai rs, merupakan ukuran non-parametrik ketergantungan statistik antara dua variabel. Ini menilai seberapa baik hubungan antara dua variabel dapat dijelaskan menggunakan fungsi monoton. Jika tidak ada diulang nilai data, korelasi Spearman sempurna +1 atau -1 terjadi ketika setiap variabel adalah fungsi monoton sempurna dari yang lain.
A.          Definisi dan perhitungan
Koefisien korelasi Spearman didefinisikan sebagai koefisien korelasi Pearson antara variabel-variabel peringkat [1] skor n baku Xi, Yi dikonversi ke peringkat xi, yi, dan ρ dihitung dari:
 \rho = 
\frac{\sum_i(x_i-\bar{x})(y_i-\bar{y})}{\sqrt{\sum_i (x_i-\bar{x})^2 
\sum_i(y_i-\bar{y})^2}}.
 
Terikat nilai ditugaskan peringkat sama dengan rata-rata posisi mereka di urutan menaik nilai. Dalam tabel di bawah ini, perhatikan bagaimana peringkat nilai-nilai yang sama adalah mean dari apa barisan mereka sebaliknya akan:
Variable Xi
Position in the descending order
Rank xi
0.8
5
5
1.2
4
\frac{4+3}{2}=3.5\
1.2
3
\frac{4+3}{2}=3.5\
2.3
2
2
18
1
1

Dalam aplikasi di mana hubungan yang dikenal untuk tidak hadir, sebuah prosedur sederhana dapat digunakan untuk menghitung ρ Perbedaan di = xi -. Yi antara jajaran masing-masing pengamatan terhadap dua variabel dihitung, dan ρ diberikan oleh :
B.      jumlah Terkait
Artikel utama: Hubungan dan ketergantungan
Ada beberapa langkah-langkah numerik lain yang mengukur tingkat ketergantungan statistik antar pasangan observasi: ini dibahas pada hubungan dan ketergantungan. Yang paling umum ini adalah produk koefisien korelasi Pearson.
Sebuah nama alternatif untuk korelasi peringkat Spearman adalah "korelasi kelas"; dalam hal ini, yang "peringkat" dari observasi diganti oleh "kelas". Dalam distribusi kontinu, kelas pengamatan adalah, dengan konvensi, selalu satu setengah kurang dari peringkat, dan karenanya korelasi kelas dan peringkat adalah sama dalam hal ini. Lebih umum, "nilai" dari pengamatan adalah sebanding dengan perkiraan dari fraksi populasi kurang dari nilai yang diberikan, dengan penyesuaian setengah pengamatan sebesar nilai diamati. Jadi ini sesuai dengan salah satu kemungkinan pengobatan peringkat terikat. Sedangkan yang tidak biasa, yang "korelasi kelas" istilah masih digunakan

Sebuah korelasi Spearman koefisien positif sesuai dengan kecenderungan peningkatan monotonik antara X dan Y.
Sebuah korelasi Spearman koefisien negatif sesuai dengan tren monoton penurunan antara X dan Y.
Tanda dari korelasi Spearman menunjukkan arah hubungan antara X (variabel independen) dan Y (variabel dependen). Jika Y cenderung meningkat ketika meningkat X, koefisien korelasi Spearman adalah positif. Jika Y cenderung menurun ketika meningkat X, koefisien korelasi Spearman negatif. Sebuah korelasi Spearman dari nol menunjukkan bahwa tidak ada kecenderungan untuk Y baik meningkatkan atau menurun ketika meningkat X. Peningkatan korelasi Spearman besarnya sebagai X dan Y menjadi lebih dekat untuk menjadi fungsi monoton sempurna satu sama lain. Ketika X dan Y sempurna monoton terkait, koefisien korelasi Spearman menjadi 1. Sebuah monoton yang sempurna meningkatkan hubungan menunjukkan bahwa untuk setiap dua pasang nilai data Xi, Yi dan Xj, YJ, bahwa Xi - Xj dan Yi - YJ selalu memiliki tanda yang sama. Sebuah monoton yang sempurna penurunan hubungan menyiratkan bahwa perbedaan-perbedaan ini selalu memiliki tanda berlawanan.
Koefisien korelasi Spearman sering digambarkan sebagai "nonparametrik." Hal ini dapat memiliki dua makna. Pertama, fakta bahwa hasil korelasi Spearman yang sempurna ketika X dan Y yang terkait oleh fungsi monoton dapat dibandingkan dengan korelasi Pearson, yang hanya memberikan nilai sempurna ketika X dan Y adalah terkait dengan fungsi linier. Rasa lain di mana korelasi Spearman adalah non-parametrik dalam distribusi yang pasti sampling dapat diperoleh tanpa pengetahuan memerlukan distribusi probabilitas bersama X dan Y.
C.     Contoh
Dalam contoh ini, kita akan menggunakan data mentah dalam tabel di bawah ini untuk menghitung korelasi antara IQ seseorang dengan jumlah jam yang dihabiskan di depan TV per minggu.
IQ, Xi
Hours of TV per week, Yi
106
7
86
0
100
27
101
50
99
28
103
29
97
20
113
12
112
6
110
17

Pertama, kita harus menemukan nilai dari istilah tersebut d^2_i. Untuk melakukannya kita gunakan langkah-langkah berikut, tercermin dalam tabel di bawah.
1.      Urutkan data dengan kolom pertama (Xi). Buat xi kolom baru dan menetapkan peringkat nilai 1,2,3, ... n.
2.      Selanjutnya, mengurutkan data dengan kolom kedua (Yi). Buat yi kolom keempat dan juga menetapkan itu peringkat nilai 1,2,3, ... n.
3.       Buat kolom kelima di untuk menahan perbedaan antara dua kolom peringkat (xi dan yi).
4.      Buat satu kolom terakhir d^2_iuntuk memegang nilai kolom di kuadrat.
IQ, Xi
Hours of TV per week, Yi
rank xi
rank yi
di
d^2_i
86
0
1
1
0
0
97
20
2
6
−4
16
99
28
3
8
−5
25
100
27
4
7
−3
9
101
50
5
10
−5
25
103
29
6
9
−3
9
106
7
7
3
4
16
110
17
8
5
3
9
112
6
9
2
7
49
113
12
10
4
6
36

Dengan ditemukan, kita dapat menambahkan mereka untuk menemukan. Nilai n adalah 10. Jadi nilai-nilai ini sekarang dapat diganti kembali ke dalam persamaan,
 \rho = 1- {\frac {6\times194}{10(10^2 - 1)}}
 
Yang bernilai ρ = ​​-0,175757575 ... Dengan nilai-P = 0.6864058 (menggunakan distribusi t)
Rendah nilai ini menunjukkan bahwa korelasi antara IQ dan jam yang dihabiskan menonton TV sangat rendah. Dalam kasus hubungan dalam nilai asli, formula ini tidak boleh digunakan. Sebaliknya, koefisien korelasi Pearson harus dihitung pada peringkat (di mana hubungan diberikan peringkat, seperti dijelaskan di atas).
D.    Menentukan makna
Salah satu pendekatan untuk menguji apakah nilai yang diamati ρ secara signifikan berbeda dari nol (r akan selalu menjaga 1 ≥ r ≥ -1) adalah untuk menghitung probabilitas bahwa akan lebih besar dari atau sama dengan r diamati, mengingat hipotesis nol, dengan menggunakan tes permutasi. Keuntungan dari pendekatan ini adalah bahwa secara otomatis memperhitungkan jumlah data diikat nilai terdapat dalam sampel, dan cara mereka diperlakukan dalam perhitungan korelasi peringkat.
Pendekatan lain sejajar dengan penggunaan transformasi Fisher dalam kasus korelasi momen-produk Pearson koefisien. Artinya, kepercayaan interval dan tes hipotesis yang berkaitan dengan ρ nilai populasi dapat dilakukan dengan menggunakan transformasi Fisher:
 F(r) = {1 \over 2}\log{1+r \over 1-r} = 
\operatorname{arctanh}(r).
Jika F (r) adalah transformasi Fisher r, sampel koefisien korelasi peringkat Spearman, dan n adalah ukuran sampel, maka
z = \sqrt{\frac{n-3}{1.06}}F(r)
 
adalah skor-z untuk r dimana sekitar mengikuti distribusi normal standar di bawah hipotesis nol kemerdekaan statistik (ρ = 0).
Satu juga dapat menguji signifikansi dengan menggunakan
t = r \sqrt{\frac{n-2}{1-r^2}}