Probleemsete DNA sekveneerimisel saadud andmete klassifitseerimistäpsuse tõstmine
Laen...
Kuupäev
Autorid
Ajakirja pealkiri
Ajakirja ISSN
Köite pealkiri
Kirjastaja
Tartu Ülikool
Abstrakt
Bakalaureusetöö eesmärk on uurida, miks üks geeniandmetel põhinenud klassifitseerimisotsus osutus valeks, ning töötada välja meetodid, mis aitaksid parandada klassifitseerimistäpsust ja suurendada mudeli usaldusväärsust. Töös analüüsitakse valesti klassifitseeritud isiku juhtumit, et tuvastada, millised geneetilised markerid võisid vale otsuse kujunemisele kaasa aidata, ning tehakse ettepanekuid mudeli täpsuse suurendamiseks. Lisaks töötatakse välja 3 alternatiivset meetodit: suurima tõepära meetod evolutsioonilise dispersioonikomponendi hindamiseks, keskmiste kauguste arvutamine lisadispersiooniga ja geneetiliste markerite eelnev filtreerimine. Samuti viiakse läbi simulatsioonid, et hinnata väljapakutud meetodite klassifitseerimistäpsust kontrollitud keskkonnas. Töö tulemustest selgus, et kõik 3 pakutud meetodit parandasid klassifitseerimistäpsust märgatavalt.
Kirjeldus
Märksõnad
DNA, genoom, haplogrupp, juhtumiuuring, logistiline regressioon, sekveneerimine, sekveneerimiskatvus, simulatsioon, suurima tõepära hinnang, case study, genome, haplogroup, logistic regression, maximum likelihood estimation, sequencing, sequencing coverage, simulation