fisher probability exact test


Dalam statistik, tes (signifikansi) yang tepat adalah ujian dimana semua asumsi yang turunan dari distribusi dari statistik uji didasarkan terpenuhi, sebagai lawan tes perkiraan, di mana pendekatan tersebut dapat dijadikan sebagai dekat seperti yang diinginkan oleh membuat ukuran sampel cukup besar. Ini akan menghasilkan sebuah uji signifikansi yang akan memiliki tingkat penolakan palsu selalu sama dengan tingkat signifikansi pengujian. Misalnya tes yang tepat pada tingkat signifikansi 5% akan dalam jangka panjang menolak hipotesis nol benar persis 5% dari waktu.
Tes parametrik, seperti yang dijelaskan dalam statistik yang tepat, tes tepat ketika asumsi parametrik sepenuhnya dipenuhi, namun dalam praktek penggunaan istilah exact test (signifikansi) diperuntukkan bagi mereka tes yang tidak berhenti pada asumsi parametrik - non- parametrik tes. Namun, dalam prakteknya sebagian besar implementasi dari software uji non-parametrik menggunakan algoritma asymptotical untuk mendapatkan nilai signifikansi, yang membuat pelaksanaan tes non-exact.
Jadi, ketika hasil dari analisis statistik dikatakan menjadi "exact test" atau "persis p-value", seharusnya untuk menyiratkan bahwa tes ini didefinisikan tanpa asumsi parametrik dan dievaluasi tanpa menggunakan algoritma perkiraan. Pada prinsipnya namun juga bisa berarti bahwa tes parametrik telah digunakan dalam situasi di mana semua asumsi parametrik terpenuhi, tetapi dalam banyak kasus tidak mungkin untuk membuktikan ini benar-benar dalam situasi dunia nyata. Pengecualian ketika dipastikan bahwa tes parametrik yang tepat termasuk pengujian berdasarkan distribusi binomial atau Poisson. Kadang-kadang tes permutasi digunakan sebagai sinonim untuk tes yang tepat, tetapi meskipun semua tes permutasi adalah tes yang tepat, tidak semua tes yang tepat adalah tes permutasi.
A.    Pengertian
Persamaan dasar yang mendasari tes permutasi adalah
 dimana:
\Pr(\text{exact})=\sum_{\mathbf{y}\,:\,T(\mathbf{y})\ge 
T(\mathbf{x)}} \Pr(\mathbf{y})
·         x adalah hasilnya benar-benar diamati,
·         Pr (y) adalah probabilitas bawah hipotesis nol dari hasil y berpotensi diamati,
·         T (y) adalah nilai dari statistik uji untuk y hasil, dengan nilai yang lebih besar dari T merupakan kasus yang notionally merupakan penyimpangan yang lebih besar dari hipotesis nol, dan di mana rentang jumlah di atas semua hasil y (termasuk yang diamati) yang memiliki nilai sama dari statistik uji diperoleh untuk sampel yang diamati x, atau yang lebih besar.
B.     Contoh: uji Pearson chi-square versus tes yang tepat
Sebuah contoh sederhana dari kesempatan untuk konsep ini dapat dilihat dengan mengamati bahwa uji Pearson chi-square adalah tes perkiraan. Misalkan uji Pearson chi-kuadrat digunakan untuk memastikan apakah sebuah dadu bersisi enam adalah "adil", yaitu memberikan masing-masing dari enam hasil sama sering. Jika dadu yang dilempar kali n, maka salah satu "mengharapkan" untuk melihat setiap n hasil / 6 kali. Uji statistic
 \sum 
\frac{(\text{observed}-\text{expected})^2}{\text{expected}}
= \sum_{k=1}^6 \frac{(X_k - n/6)^2}{n/6},

dimana Xk adalah jumlah k hasil kali diamati. Jika hipotesis nol dari "keadilan" adalah benar, maka distribusi probabilitas dari statistik uji dapat dibuat sedekat diinginkan untuk distribusi chi-kuadrat dengan 5 derajat kebebasan dengan membuat ukuran sampel n cukup besar. Tetapi jika n adalah kecil, maka berdasarkan probabilitas distribusi chi-kuadrat mungkin tidak pendekatan sangat dekat. Menemukan yang tepat probabilitas bahwa uji statistik melebihi nilai tertentu maka membutuhkan penghitungan kombinatorial dari semua hasil percobaan yang menghasilkan seperti nilai besar uji statistik. Selain itu, menjadi dipertanyakan apakah uji statistik yang sama seharusnya digunakan. Tes kemungkinan-rasio mungkin lebih disukai sebagai lebih kuat, dan uji statistik tidak mungkin fungsi monoton dari satu di atas.
C.     Contoh: Fisher exact test
Fisher exact test adalah tepat karena distribusi sampling (tergantung pada marjinal) yang diketahui secara pasti. Bandingkan uji Pearson chi-kuadrat, yang (meskipun tes null sama) adalah tidak tepat karena distribusi dari statistik uji benar hanya asimtotik