Päritolu hindamine geeniandmete põhjal: TÜ Eesti Geenivaramu andmete analüüs

Date

2018

Journal Title

Journal ISSN

Volume Title

Publisher

Abstract

Käesoleva magistritöö eesmärk on leida võimalusi andmaks geenidoonoritele tagasisidet nende päritolu kohta, lähtudes SNPde andmetest. Nendele tuginedes on leitud peakomponendid, millele rajaneb edasine analüüs. Esmalt kirjeldatakse päritolu rahvuste tasandil, mille käigus antakse doonorile tõenäosuslik hinnang kuulumise kohta 22 rahvusgrupi hulka. Sellele järgnevalt kirjeldatakse päritolu Eesti-siseselt, kus leitakse K-keskmiste klasterdamise algoritmi abil Eesti sees tekkivad klastrid, mis moodustavad geograafiliselt loogilisi tervikuid. Klasterdamise tulemusi rakendatakse selleks, et klassifitseerida tekkinud klastrite alusel ning pakkuda ka hinnang klastritesse kuulumise tõenäosustele. Ühtlasi kontrollitakse, kui hästi töötab Eesti-sisene klassifitseerimine, valides klassideks maakonnad. Klassifitseerimismeetoditest võrreldakse lineaarset diskriminantanalüüsi, tugivektormasinaid ning juhuslikke metsi.

Description

Keywords

simulatsioon, kõrgdimensionaalsed andmed, klasteranalüüs, klassifitseerimine, tehisõpe, mitmemõõtmeline skaleerimine, simulation, high-dimensional data, automatic learning, multidimensional scaling, cluster analysis, classification

Citation