Probleemsete DNA sekveneerimisel saadud andmete klassifitseerimistäpsuse tõstmine

Laen...
Pisipilt

Kuupäev

Ajakirja pealkiri

Ajakirja ISSN

Köite pealkiri

Kirjastaja

Tartu Ülikool

Abstrakt

Bakalaureusetöö eesmärk on uurida, miks üks geeniandmetel põhinenud klassifitseerimisotsus osutus valeks, ning töötada välja meetodid, mis aitaksid parandada klassifitseerimistäpsust ja suurendada mudeli usaldusväärsust. Töös analüüsitakse valesti klassifitseeritud isiku juhtumit, et tuvastada, millised geneetilised markerid võisid vale otsuse kujunemisele kaasa aidata, ning tehakse ettepanekuid mudeli täpsuse suurendamiseks. Lisaks töötatakse välja 3 alternatiivset meetodit: suurima tõepära meetod evolutsioonilise dispersioonikomponendi hindamiseks, keskmiste kauguste arvutamine lisadispersiooniga ja geneetiliste markerite eelnev filtreerimine. Samuti viiakse läbi simulatsioonid, et hinnata väljapakutud meetodite klassifitseerimistäpsust kontrollitud keskkonnas. Töö tulemustest selgus, et kõik 3 pakutud meetodit parandasid klassifitseerimistäpsust märgatavalt.

Kirjeldus

Märksõnad

DNA, genoom, haplogrupp, juhtumiuuring, logistiline regressioon, sekveneerimine, sekveneerimiskatvus, simulatsioon, suurima tõepära hinnang, case study, genome, haplogroup, logistic regression, maximum likelihood estimation, sequencing, sequencing coverage, simulation

Viide