MDL-meetod diferentsiaalselt metüleeritud regioonide tuvastamiseks

dc.contributor.advisorKolde, Raivo, juhendajaet
dc.contributor.authorMärtens, Kasparet
dc.contributor.otherTartu Ülikool. Matemaatika-informaatikateaduskondet
dc.contributor.otherTartu Ülikool. Matemaatilise statistika instituutet
dc.date.accessioned2013-07-03T11:28:56Z
dc.date.available2013-07-03T11:28:56Z
dc.date.issued2013-06-06
dc.description.abstractBioloogilist huvi pakub küsimus, millised tegurid reguleerivad geenide avaldumist. DNA metülatsioon on üks mitmetest mehhanismidest, mida rakkudes kasutatakse geenide vaigistamiseks. Metülatsioon omab funktsionaalset rolli ainult DNA järjestuse kindlatel positsioonidel, mida nimetatakse CpG saitideks. Tihti on järjestikuste CpG saitide metüleeritus sarnane, seega on mõttekas otsida ühesuguse metülatsioonimustriga pikemaid regioone. Diferentsiaalselt metüleeritud regioonideks (DMR) nimetatakse selliseid järjestikusi CpG saite, kus erinevate gruppide (näiteks vähihaigete ja tervete, noorte ja vanade indiviidide või erinevat tüüpi kudede) vahel on metüleerituses erinevusi. Käesoleva bakalaureusetöö eesmärgiks on välja töötada meetod diferentsiaalselt metüleeritud regioonide tuvastamiseks, mida saaks kasutada eelkõige metülatsioonikiibi andmetel. Selleks soovime jagada DNA järjestuse optimaalsel viisil segmentideks ning seejärel teha iga segmendi kohta otsuse, kas seal esineb diferentsiaalne metülatsioon või mitte. Töö algul antakse ülevaade DNA metülatsioonist ning formuleeritakse matemaatiline probleem, mis seisneb andmetest järjestikuste segmentide leidmises. Järgneb ülevaade tõenäosuslike mudelite kodeerimisest ning MDL-printsiibist, sest sellele toetume optimaalse segmentatsiooni leidmisel. Peatükis 3 on toodud üldine raamistik, mille kohaselt jagada andmed parimal viisil segmentideks, kasutades segmendiviisi defineeritud mudeleid ning valides neist MDLi mõttes parima. Selline raamistik võimaldab kasutada segmentidel andmete kirjeldamiseks suvalisi mudeleid, mille alusel on võimalik arvutada andmete tõepära. Seejärel on seda raamistikku kasutatud kahe konkreetse meetodi jaoks. Neist on lähemalt uuritud meetodit, mis põhineb segmentidele lineaarsete mudelite sobitamisel: testime seda nii simuleeritud kui ka bioloogilistel andmetel, lisaks võrdleme saadud tulemusi ühe võimaliku alternatiiviga. Need mõlemad meetodid implementeeriti programmeerimiskeeles R.et
dc.identifier.urihttp://hdl.handle.net/10062/31701
dc.language.isoetet
dc.publisherTartu Ülikoolet
dc.subject.otherbakalaureusetöödet
dc.titleMDL-meetod diferentsiaalselt metüleeritud regioonide tuvastamisekset
dc.typeThesiset

Failid

Originaal pakett

Nüüd näidatakse 1 - 1 1
Laen...
Pisipilt
Nimi:
martens_kaspar_2013.pdf
Suurus:
1.09 MB
Formaat:
Adobe Portable Document Format

Litsentsi pakett

Nüüd näidatakse 1 - 1 1
Pisipilt ei ole saadaval
Nimi:
license.txt
Suurus:
1.71 KB
Formaat:
Item-specific license agreed upon to submission
Kirjeldus: