Korrespondentsanalüüs ja andmete dubleerimine
Kuupäev
2013-06-12
Autorid
Ajakirja pealkiri
Ajakirja ISSN
Köite pealkiri
Kirjastaja
Tartu Ülikool
Abstrakt
Korrespondentsanalüüsi saab kasutada väga hästi risttabeliga, kus on 2 rida või 2 veergu, saades numbrilised väärtused nii rea, kui ka tulpade kategooriatele. Need väärtused (skoorid) saadakse nii, et need kirjeldaks kahe tunnusevahelist seost nii palju kui võimalik. Enamasti on rea ja tulba kategooriad esitatud kahemõõtmelisel graafikul, kus asuvad vastavate skooride paarid. Selline esitlus annab lugejale ülevaate rea- ja veerukategooriate erinevustest ja sarnasustest. See meetod on väga sarnane peakomponentide analüüsiga, mida saab kasutada selleks, et selgitada välja dimensioonid, mis kirjeldavad andmestikku kõige paremini. Korrespondentsanalüüsi saab kasutada ka väga suurte andmestike korral, kus nii ridade kui ka veergude arv on väga suur. Korrespondentsanalüüsi saab läbi viia mitmete statistikaprogrammide abil, nagu näiteks SAS, SPSS, BMDP jne. Meie kasutame siin töös aga rakendustarkvara SAS.
Töö on jaotatud kahte suurde peatükki. Esimeses osas on autori eesmärk anda teoreetiline ülevaade korrespondentsanalüüsi matemaatilisest meetodist. Töö teises pooles on korrespondentsanalüüsi rakendamine reaalsete vaatlusandmete põhjal. Autor on lisaks viinud läbi ka andmete dubleerimise, et vaatlusandmeid põhjalikumalt analüüsida.