Hii-ruut testid

Hii-ruut testiga kontrollitakse mitmeid erinevaid hüpoteese. Kõige levinum on ehk kahemõõtmelise sagedustabeli põhjal tunnustevahelise seose olemasolu kontrollimine. Seda ja ka ühemõõtmelise jaotuse vastavust oodatule saab kontrollida funktsiooni chisq.test abil

Kahemõõtmelise sagedustabeli korral (sisend on maatriks) piisab ühest sisendist

> sagedused=matrix(c(34,11,9,17),nrow=2)
> chisq.test(sagedused)

Pearson's Chi-squared test with Yates' continuity correction

data: sagedused
X-squared = 9.9136, df = 1, p-value = 0.001641

ühemõõtmelise jaotuse korral vajame lisaks mõõdetud sagedustele ka oodatavaid sagedusi (tegelikult oodatakse p argumendina tõenäosusi, ent kui lisaks määrata rescale.p=T, siis muudetakse oodatud sagedused ise tõenäosusteks).

> sagedused2=c(42,29,69)
> oodati=c(30,30,80)
> chisq.test(sagedused2,p=oodati,rescale.p=T)

Chi-squared test for given probabilities

data: sagedused2
X-squared = 6.3458, df = 2, p-value = 0.04188


Lisaks baseerub hii-ruut statistikul ka funktsiooni prop.test töö, mis võimaldab kontrollida, kas kõikides gruppides jaotub binaarne tunnus samas suhtes (ehk siis kontrollida sedasama, mida võimaldab chisq.test kitsendusega, et üks tunnus on binaarne), ent lisaks saab kontrollida ka jaotumise vastamist etteantud jaotumisskeemile (mis võib grupiti olla erinev). Järgnevaga testime näiteks, kas esimeses grupis (milles vaadeldud õnnestunud ja ebaõnnestunud katsete arv on sisendmaatriksi esimeses reas) võib edu tõenäosus üksikkatsel olla 0.6 ja teises grupis (milles vaadeldud õnnestunud ja ebaõnnestunud katsete arv on sisendmaatriksi teises reas) samal ajal 0.4.

> prop.test(sagedused,p=c(0.6,0.4))

        2-sample test for given proportions with continuity correction

data:  sagedused, null probabilities c(0.6, 0.4)
X-squared = 5.7585, df = 2, p-value = 0.05618
alternative hypothesis: two.sided
null values:
prop 1 prop 2
   0.6    0.4
sample estimates:
   prop 1    prop 2
0.7906977 0.3928571

Viimane rakendus on seega näide olukorrast, kus sisuliselt kombineerime mitu küsimust ühte testi ehk teeme omnibustesti -- nullhüpoteesi kummutamine näitab, et vähemalt ühes grupis on asjad (suure tõenäosusega) paigast ära.