Mudelipõhise klasteranalüüsi ja K-medoidide meetodi võrdlemine kvalitatiivsete tunnustega andmete klasterdamisel
Abstract
Magistritöö eesmärk on võrrelda kaht erinevat klasteranalüüsi meetodit, kus üks on mudelipõhine ja teine põhineb vaatlustevahelistel kaugustel. Täpsemalt, võrreldakse mudelipõhist klasteranalüüsi ja K-medoidide meetodit kvalitatiivsete tunnuste korral. K-medoidide meetodi rakendamiseks kasutatakse PAM-algoritmi (partitioning around medoids). Mudelipõhise klasteranalüüsi puhul on vaatlused kirjeldatud segujaotuse abil, samal ajal PAM-algoritm põhineb erinevusmõõtudel. Viiakse läbi simulatsioonid erinevate klastrite kattuvusmäärade korral ja uuritakse mõlema klasterdusmeetodi käitumist erinevate kattuvuste korral. Et tulemusi analüüsida, kasutatakse kohandatud Randi indeksit ja keskmise silueti laiuse kriteeriumit.
Collections
The following license files are associated with this item: