Mudelipõhine klasteranalüüs
dc.contributor.advisor | Kuljus, Kristi, juhendaja | |
dc.contributor.author | Mirski, Sören | |
dc.contributor.other | Tartu Ülikool. Loodus- ja täppisteaduste valdkond | et |
dc.contributor.other | Tartu Ülikool. Matemaatika ja statistika instituut | et |
dc.date.accessioned | 2019-07-23T08:01:28Z | |
dc.date.available | 2019-07-23T08:01:28Z | |
dc.date.issued | 2019 | |
dc.description.abstract | Mudelipõhiste klasterdamismeetodite korral eeldatakse, et vaatlusi on sobiv kirjeldada segujaotuse abil, mille iga komponent määrab ühe klastri. Mudelipõhine klasteranalüüs leiab üha enam kasutamist, kuna sel juhul asendub sobiva klasterdamismeetodi valik statistilise mudeli valikuga ja optimaalse klastrite arvu leidmise ülesanne taandub segujaotuse komponentide arvu hindamise ülesandeks. Käesoleva magistritöö eesmärk on anda ülevaade mudelipõhise klasteranalüüsi teostamisest kvantitatiivsete, kvalitatiivsete ning segatüüpi tunnuste korral. Töö esimeses peatükis defineeritakse segujaotused erinevat tüüpi tunnuste korral ning selgitatakse, kuidas EM-algoritmiga nende jaotuste parameetreid hinnatakse. Lisaks tuletatakse niinimetatud integreeritud klassifitseerimistõepära ehk ICL kriteerium, mida mudelipõhise klasteranalüüsi korral kasutatakse segumudeli sobivuse ja klastrite arvu hindamiseks. Töö teises peatükis rakendatakse mudelipõhist klasterdamist Tartu Ülikooli Eesti Geenivaramu biomarkerite andmestikule, mis sisaldab nii kvantitatiivseid kui ka kvalitatiivseid tunnuseid. | et |
dc.identifier.uri | http://hdl.handle.net/10062/64860 | |
dc.language.iso | est | et |
dc.rights | openAccess | et |
dc.rights | Autorile viitamine + Mitteäriline eesmärk + Tuletatud teoste keeld 3.0 Eesti | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/ee/ | * |
dc.subject | R (programmeerimiskeel) | et |
dc.subject | R (programming language) | en |
dc.subject.other | klasteranalüüs | et |
dc.subject.other | tõenäosusjaotused | et |
dc.subject.other | normaaljaotus | et |
dc.subject.other | simulatsioon | et |
dc.subject.other | geenidoonorid | et |
dc.subject.other | biomarkerid | et |
dc.subject.other | biomarkers | en |
dc.subject.other | cluster analysis | en |
dc.subject.other | probability distributions | en |
dc.subject.other | gene donors | en |
dc.subject.other | simulation | en |
dc.subject.other | normal distribution | en |
dc.title | Mudelipõhine klasteranalüüs | et |
dc.type | info:eu-repo/semantics/masterThesis | et |