Möls, Märt, juhendajaIljašenko, TatjanaTartu Ülikool. Matemaatika-informaatikateaduskondTartu Ülikool. Matemaatilise statistika instituut2013-07-022013-07-022013-06-11http://hdl.handle.net/10062/31632Käesoleva töö põhieesmärgiks on kontrollida IMPUTE2 programmi abil imputeeritud geneetiliste markerite kvaliteeti ja programmi poolt väljastatavate kvaliteedihinnangute kvaliteeti. Eesmärgi saavutamiseks teostatakse kolm erinevat imputeerimisprotsessi, milledest esimene viiakse läbi nö ideaaltingimustes. Võetakse juhuslik valim 1000 Genoomi Projekti haplotüüpide seast. Valimisse sattunud haplotüüpidest eemaldatakse osa geneetiliste markerite väärtustest. Seejärel imputeeritakse puuduolevate markerite väärtused, kasutades referentspaneelina esialgse koguandmestiku ilma valimisse sattunud haplotüüpideta. Teise imputeerimise eesmärk seisneb selles, et eurooplaste referenshaplotüüpe kasutades (see ongi 1000 Genoomi Projekti raames kogutud andmed), imputeerida genotüpiseeritud eestlaste andmetes puuduolevate markerite väärtusi. Selleks kasutatakse samuti 1000 Genoomi Projekti raames kogutud andmeid referentspaneelina, kuid seekord jäetakse välja teatud hulk geneetilisi markereid, et viia referentspaneelina kasutatava andmestiku vastavusse eestlaste genotüüpiseeritud andmetega markerite nimekirja suhtes. Valim moodustatakse seekord eestlaste genotüpiseeritud andmetest, korjates sealt välja hulk teatud markereid. Seejärel imputeeritakse ettevalmistatud eurooplaste haplotüüpide andmestiku abil väljakorjatud markerite väärtusi tagasi. Kolmanda imputeerimise ülesandeks on ennustada eestlaste geeniandmeid, kasutades referentspaneelina eestlaste genotüpiseeritud andmeid, mis koosnevad 49 indiviidi sekveneeritud andmetest ehk kindlaks määratud DNA molekulide aminohapete ja nukleotiitide järjestusest [3]. Valimi moodustamisel valitakse juhuslikult 15 indiviidi andmed 49 indiviidi andmete seast, kust jäetakse välja hulk teatud markereid. Referentspaneeli jääb 34 indiviidi. Eestlaste andmed on saadud Eesti Geenivaramust. Töö esimeses ja teises peatükkides antakse detailne ülevaade imputeerimisprotsessist ja sellega seotud mõistetest ning programmis IMPUTE2 kasutatud meetodist. Kolmandas peatükis analüüsitakse imputeerimistulemusi ja nende kvaliteeti. Neljas peatükis tutvustatakse imputeerimise kvaliteedihinnangu analüüsil kasutatud meetodeid ning analüüsitakse programmi IMPUTE2 poolt raporteeritute kvaliteedihinnangute usaldusväärsust.etmagistritöödGeneetiliste markerite imputeerimineThesis