MDL-meetod diferentsiaalselt metüleeritud regioonide tuvastamiseks
Kuupäev
2013-06-06
Autorid
Ajakirja pealkiri
Ajakirja ISSN
Köite pealkiri
Kirjastaja
Tartu Ülikool
Abstrakt
Bioloogilist huvi pakub küsimus, millised tegurid reguleerivad geenide avaldumist. DNA metülatsioon on üks mitmetest mehhanismidest, mida rakkudes kasutatakse geenide vaigistamiseks. Metülatsioon omab funktsionaalset rolli ainult DNA järjestuse kindlatel
positsioonidel, mida nimetatakse CpG saitideks. Tihti on järjestikuste CpG saitide metüleeritus sarnane, seega on mõttekas otsida ühesuguse metülatsioonimustriga pikemaid regioone. Diferentsiaalselt metüleeritud regioonideks (DMR) nimetatakse selliseid järjestikusi CpG saite, kus erinevate gruppide (näiteks vähihaigete ja tervete, noorte ja vanade indiviidide või erinevat tüüpi kudede) vahel on metüleerituses erinevusi.
Käesoleva bakalaureusetöö eesmärgiks on välja töötada meetod diferentsiaalselt metüleeritud regioonide tuvastamiseks, mida saaks kasutada eelkõige metülatsioonikiibi andmetel. Selleks soovime jagada DNA järjestuse optimaalsel viisil segmentideks ning seejärel teha iga segmendi kohta otsuse, kas seal esineb diferentsiaalne metülatsioon või mitte.
Töö algul antakse ülevaade DNA metülatsioonist ning formuleeritakse matemaatiline probleem, mis seisneb andmetest järjestikuste segmentide leidmises. Järgneb ülevaade tõenäosuslike mudelite kodeerimisest ning MDL-printsiibist, sest sellele toetume optimaalse segmentatsiooni leidmisel. Peatükis 3 on toodud üldine raamistik, mille kohaselt jagada andmed parimal viisil segmentideks, kasutades segmendiviisi defineeritud mudeleid ning valides neist MDLi mõttes parima. Selline raamistik võimaldab kasutada segmentidel andmete kirjeldamiseks suvalisi mudeleid, mille alusel on võimalik arvutada
andmete tõepära. Seejärel on seda raamistikku kasutatud kahe konkreetse meetodi jaoks. Neist on lähemalt uuritud meetodit, mis põhineb segmentidele lineaarsete mudelite sobitamisel: testime seda nii simuleeritud kui ka bioloogilistel andmetel, lisaks võrdleme saadud tulemusi ühe võimaliku alternatiiviga.
Need mõlemad meetodid implementeeriti programmeerimiskeeles R.