Mudelipõhine klasteranalüüs

dc.contributor.advisorKuljus, Kristi, juhendaja
dc.contributor.authorMirski, Sören
dc.contributor.otherTartu Ülikool. Loodus- ja täppisteaduste valdkondet
dc.contributor.otherTartu Ülikool. Matemaatika ja statistika instituutet
dc.date.accessioned2019-07-23T08:01:28Z
dc.date.available2019-07-23T08:01:28Z
dc.date.issued2019
dc.description.abstractMudelipõhiste klasterdamismeetodite korral eeldatakse, et vaatlusi on sobiv kirjeldada segujaotuse abil, mille iga komponent määrab ühe klastri. Mudelipõhine klasteranalüüs leiab üha enam kasutamist, kuna sel juhul asendub sobiva klasterdamismeetodi valik statistilise mudeli valikuga ja optimaalse klastrite arvu leidmise ülesanne taandub segujaotuse komponentide arvu hindamise ülesandeks. Käesoleva magistritöö eesmärk on anda ülevaade mudelipõhise klasteranalüüsi teostamisest kvantitatiivsete, kvalitatiivsete ning segatüüpi tunnuste korral. Töö esimeses peatükis defineeritakse segujaotused erinevat tüüpi tunnuste korral ning selgitatakse, kuidas EM-algoritmiga nende jaotuste parameetreid hinnatakse. Lisaks tuletatakse niinimetatud integreeritud klassifitseerimistõepära ehk ICL kriteerium, mida mudelipõhise klasteranalüüsi korral kasutatakse segumudeli sobivuse ja klastrite arvu hindamiseks. Töö teises peatükis rakendatakse mudelipõhist klasterdamist Tartu Ülikooli Eesti Geenivaramu biomarkerite andmestikule, mis sisaldab nii kvantitatiivseid kui ka kvalitatiivseid tunnuseid.et
dc.identifier.urihttp://hdl.handle.net/10062/64860
dc.language.isoestet
dc.rightsopenAccesset
dc.rightsAutorile viitamine + Mitteäriline eesmärk + Tuletatud teoste keeld 3.0 Eesti*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/ee/*
dc.subjectR (programmeerimiskeel)et
dc.subjectR (programming language)en
dc.subject.otherklasteranalüüset
dc.subject.othertõenäosusjaotusedet
dc.subject.othernormaaljaotuset
dc.subject.othersimulatsioonet
dc.subject.othergeenidoonoridet
dc.subject.otherbiomarkeridet
dc.subject.otherbiomarkersen
dc.subject.othercluster analysisen
dc.subject.otherprobability distributionsen
dc.subject.othergene donorsen
dc.subject.othersimulationen
dc.subject.othernormal distributionen
dc.titleMudelipõhine klasteranalüüset
dc.typeinfo:eu-repo/semantics/masterThesiset

Files

Original bundle
Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
mirski_soren_msc_2019.pdf
Size:
682.14 KB
Format:
Adobe Portable Document Format
Description:
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed upon to submission
Description: