Mudelipõhise klasteranalüüsi ja K-medoidide meetodi võrdlemine kvalitatiivsete tunnustega andmete klasterdamisel

Date

2020

Journal Title

Journal ISSN

Volume Title

Publisher

Abstract

Magistritöö eesmärk on võrrelda kaht erinevat klasteranalüüsi meetodit, kus üks on mudelipõhine ja teine põhineb vaatlustevahelistel kaugustel. Täpsemalt, võrreldakse mudelipõhist klasteranalüüsi ja K-medoidide meetodit kvalitatiivsete tunnuste korral. K-medoidide meetodi rakendamiseks kasutatakse PAM-algoritmi (partitioning around medoids). Mudelipõhise klasteranalüüsi puhul on vaatlused kirjeldatud segujaotuse abil, samal ajal PAM-algoritm põhineb erinevusmõõtudel. Viiakse läbi simulatsioonid erinevate klastrite kattuvusmäärade korral ja uuritakse mõlema klasterdusmeetodi käitumist erinevate kattuvuste korral. Et tulemusi analüüsida, kasutatakse kohandatud Randi indeksit ja keskmise silueti laiuse kriteeriumit.

Description

Keywords

keskmise silueti laiuse kriteerium, kohandatud Randi indeks, PAM-algoritm, R (programmeerimiskeel), adjusted Rand index, average silhouette width, PAM algorithm, R (programming language)

Citation