Statistiline test k-meeride abil DNA tandemkorduse koopiaarvu määramiseks

Date

2015

Authors

Journal Title

Journal ISSN

Volume Title

Publisher

Tartu Ülikool

Abstract

Käesoleva töö eesmärgiks on välja töötada statistiline test, mille abil on võimalik kindlaks määrata, kas indiviidi DNA tandemkorduse koopiaarv ehk DNA ahelas järjestikku korduva osa korduste arv vastab referentsgenoomis kirjapandud korduste arvule. Kui tandemkorduse koopiaarv varieerub indiviiditi, siis on tegemist varieeruva arvuga tandemkordusega ehk VNTR-iga. Varieeruva arvuga tandemkorduste ülesleidmine võimaldab paremini kirjeldada indiviididevahelisi geneetilisi erinevusi. Samuti kasutatakse neid kriminalistikas kurjategija tuvastamiseks kuriteopaigalt leitud DNA põhjal. Geeniandmed on tavaliselt väga suured ja mahukad, mistõttu nende töötlemine on aeglane ja kulukas. Käesolevas töös väljatöötatud testis vaadeldakse tandemkorduse korduvat osa kui k-meeri (DNA sekveneeritud jupilt moodustatud väiksemat k nukleotiidi pikkust osa) ning teststatistiku leidmiseks loetakse kokku, mitu korda antud k-meeri sekveneerimisandmetes esines. Kuna k-meeride arvu lugemiseks on olemas kiired algoritmid, siis on ka sellisel meetodil testimiseks kuluv aeg väiksem. Töös arvutatakse teststatistiku jaotus nullhüpoteesi kehtides ning selle põhjal koostatakse statistiline test ning leitakse ka testi võimsus tuvastada tõenäoliseimaid koopiaarvu muutuseid.

Description

Keywords

andmeanalüüs, DNA genoom, DNA koopiaarvu variatsioonid, DNA kordusjärjestus, genoomika, k-meer, lugem, statistilised meetodid, testimine

Citation