Lähtekoht ja põhitestid

Enne mistahes statistilise testi läbiviimist või mudeli sobitamist on meil vaja andmeid. Seejuures peavad andmed olema ka sobival kujul. Ehkki sageli võimaldavad R-is defineeritud funktsioonid kasutada andmeid mitut moodi (näiteks t-testi läbiviimisel võime anda sisendina kaks vektorit, kus üks sisaldab ühe ja teine teise grupi valimit aga võime ka anda kaks vektorit, millest üks sisaldab uuritava tunnuse väärtusi ja teine vektor (faktor) määrab ära, millisesse gruppi üks või teine vaatlus kuulub) vaatleme meie võimaluse nn. mudelisüntaksit (kõik tunnused on ühe pikkusega, tunnus võib olla ka klassi kuulumise indikaator).

Üldiselt on alati sobivaks lähtekohaks andmemaatriks, kus gruppidesse jagunemist kirjeldavad faktorid. Peamised lihtsamad testid ongi juba eelnevalt mainitud t-test (millel on palju erijuhte) aga muidugi ka erinevad hii-ruut testid. Samuti normaalsuse testid, dispersioonide võrdlemise testid, korrelatsioonikordaja statistilise olulisuse test. Lisaks veel t-testi mitteparameetrilised analoogid.

Lõpuks veel, et kriitilisi väärtusi (või otseseid olulisustõenäosusi kui meil on statistiku väärtus välja arvutatud) saame tuntud jaotuste korral samuti kergelt leida -- näiteks normaaljaotuse jaoks on olemas funktsioonid pnorm ja qnorm, mis võimaldavad leida vastavalt jaotusfunktsiooni väärtust sisestatud kohal ja sisendväärtusele vastavat kvantiili. Nii näiteks

> pnorm(1.96)
[1] 0.9750021

> qnorm(0.99)
[1] 2.326348

Muidugi saab nendele funktsioonidele ette anda ka jaotuse parameetrid (kui me näiteks pole huvitatud standardsest normaaljaotusest). Funktsioonide nimed teiste jaotuste korral on analoogilised -- tähele p või q järgneb jaotuse nimi (või selle lühend). Näiteks qt, qf, qexp, qlnorm, qbinom, qpois, qchisq.