Päritolu hindamine geeniandmete põhjal: TÜ Eesti Geenivaramu andmete analüüs
Date
2018
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
Käesoleva magistritöö eesmärk on leida võimalusi andmaks geenidoonoritele tagasisidet nende päritolu kohta, lähtudes SNPde andmetest. Nendele tuginedes on leitud peakomponendid, millele rajaneb edasine analüüs. Esmalt kirjeldatakse päritolu rahvuste tasandil, mille käigus antakse doonorile tõenäosuslik hinnang kuulumise kohta 22 rahvusgrupi hulka. Sellele järgnevalt kirjeldatakse päritolu Eesti-siseselt, kus leitakse K-keskmiste klasterdamise algoritmi abil Eesti sees tekkivad klastrid, mis moodustavad geograafiliselt loogilisi tervikuid. Klasterdamise tulemusi rakendatakse selleks, et klassifitseerida tekkinud klastrite alusel ning pakkuda ka hinnang klastritesse kuulumise tõenäosustele. Ühtlasi kontrollitakse, kui hästi töötab Eesti-sisene klassifitseerimine, valides klassideks maakonnad. Klassifitseerimismeetoditest võrreldakse lineaarset diskriminantanalüüsi, tugivektormasinaid ning juhuslikke metsi.
Description
Keywords
simulatsioon, kõrgdimensionaalsed andmed, klasteranalüüs, klassifitseerimine, tehisõpe, mitmemõõtmeline skaleerimine, simulation, high-dimensional data, automatic learning, multidimensional scaling, cluster analysis, classification