Cum sunt distribuite valorile P sub Null?

(Acest articol a fost publicat pentru prima dată pe R – blogul lui Davidși cu amabilitate a contribuit la R-bloggeri). (Puteți raporta problema legată de conținutul acestei pagini aici)

Doriți să vă distribuiți conținutul pe R-bloggeri? dați clic aici dacă aveți un blog, sau aici dacă nu aveți.

Uneori folosesc această întrebare amuzantă de interviu pentru aspiranții cercetători de date:

Cum sunt distribuite valorile p presupunând că ipoteza nulă este adevărată?

Am auzit o mulțime de răspunsuri rezonabile, inclusiv:

Ar trebui să fie centrat pe valori mari
ar trebui să aibă o masă aproape zero sub 0,05
Depinde de model
Depinde de ipoteza nulă

Toate răspunsurile foarte rezonabile și intuitive pe care probabil, la un moment dat, mi le-aș fi dat. De asemenea, toți greșesc.

Răspunsul (poate surprinzător) este că sub orice ipoteza nulă, valorile p sunt distribuite uniform: toate Valorile p între 0 și 1 sunt la fel de probabile.

Înainte de a da o dovadă formală, iată câteva intuiții. Pentru orice nivel de semnificație $alpha$, cât de des va obține un rezultat semnificativ un test statistic sub valoarea nulă? Desigur $alpha$, după definiția nivelului de semnificație. Dar pentru ca un test să fie semnificativ la $alpha$, trebuie să fie adevărat că valoarea p $p < alpha$. Deci spunem că $p < alpha$ cu probabilitate $alpha$. Sau $Pr(p < alpha) = alpha$, care este definiția unei distribuții uniforme.

Mai formal, atunci când efectuăm un test statistic, calculăm o statistică $hat{S}$ din date. Sub null, această statistică urmează o distribuție $S$. Statistica $hat{S}$ este asociată cu o valoare p $hat{p}$, care, prin definiție, este probabilitatea ca statistica de test să fie cel puțin la fel de extremă ca $hat{S}$: $ hat{p} = Pr(S > hat{S})$. Dar rețineți, de asemenea, că pentru ca valoarea p să fie mai mică decât $hat{p}$ ar fi nevoie ca statistica de test să fie mai mare decât $hat{S}$, deci $Pr(p < hat{p}) = Pr(S > hat{S})$, despre care tocmai am spus că este egal cu $hat{p}$. Deci $Pr(p < hat{p}) = hat{p}$, care este din nou definiția unei distribuții uniforme.

Observați că nicăieri nu a trebuit să presupun nimic despre $S$, distribuția statisticii testului. Acest rezultat este valabil indiferent de statistica de testare pe care o facem. Să vedem acest lucru în acțiune pentru două teste statistice comune.

Testul t

Testul t testează egalitatea mediilor între două eșantioane. Ipoteza nulă afirmă că ambele eșantioane sunt extrase din aceeași distribuție (normală). Deci, pentru a vedea cum este distribuită valoarea p, vom extrage două eșantioane de dimensiuni egale din aceeași distribuție, vom calcula valoarea p din testul t și vom repeta:

one_ttest <- function() {
  x <- rnorm(100)
  y <- rnorm(100)
  test <- t.test(x, y)
  test$p.value
}

p_values_ttest <- replicate(1000, one_ttest())

hist(p_values_ttest)

După cum era de așteptat, valorile p sunt distribuite uniform de la 0 la 1. Nu există dovezi ale vreunei acumulări de masă către valori mai mari și nici nu există dovezi că valorile p mai mici de 0,05 sunt mai puțin probabile.

Testul binom

Testul binom testează dacă o proporție empirică este diferită de o proporție ipotetică $p$. Ipoteza nulă afirmă că eșantionul este extras dintr-o populație în care condiția de interes se întâmplă cu probabilitatea $p$. Deci vom urma aceeași metodă ca mai sus:

one_binomtest <- function() {
  prob <- 0.2
  successes <- rbinom(1, 1000, prob)
  test <- binom.test(successes, 1000, p = prob)
  test$p.value
}

p_values_binomtest <- replicate(1000, one_binomtest())

hist(p_values_binomtest)

Ca mai sus, nu există niciun motiv să bănuiți că valorile p sunt altceva decât distribuite uniform

Concluzie

În testul t sau testul binom nu a trebuit să specificăm niciun nivel de semnificație, doar ne-am uitat la distribuția unei valori p presupunând că ipoteza nulă este adevărată. Am constatat că, așa cum a prezis teorie, valorile p sunt distribuite uniform între 0 și 1 și, prin urmare, probabilitatea de a respinge nulul la un nivel de semnificație $alpha$ este tocmai $alpha$. Toate valorile p între 0 și 1 sunt la fel de probabile, indiferent de testul statistic pe care îl utilizați (cu unele excepții, cum ar fi o distribuție de test discretă).

Addendum

Am postat un scurt videoclip pe YouTube care ilustrează aceste exemple.

Postarea Cum sunt distribuite valorile P sub nul? a apărut prima dată pe blogul lui David.

Cum sunt distribuite valorile P sub Null?

Testul t

Testul binom

Concluzie

Addendum

LĂSAȚI UN MESAJ Renunțați la răspuns