Peterson, HediSügis, ElenaEllervee, Andreas2017-04-262017-04-262015http://hdl.handle.net/10062/56113Käesoleva bakalaureusetöö eesmärgiks on automaatselt leida geenidevahelisi seoseid suuremahulistest eksperimentaalsetest andmetest. Olenevalt eksperimendi tüübist saame me tihtipeale teada vaid osa tegelikest regulatoorsetest seostest geenide vahel. Kombineerides erinevaid eksperimente saame aga täpsemini määratleda otseseid ja kaudseid seoseid, mis määravad ära rakkude seisundi mingil kindlal tingimusel. Geenide häirituse (ingl k. perturbation) eksperimendiga on võimalik leida need geenid, mida häiritud geen mõjutab, kas siis otseselt või kaudselt. Kui neid andmeid kombineerida kromatiinisadestamise andmetega, siis saame eraldada otseselt mõjutatud geenid kaudselt mõjutatutest. Käesoleva töö eesmärk ongi leida kaudselt mõjutatud geenidele võimalikke regulaatoreid, mis vahendaksid signaali häiritud geenilt. Signaalivahendajate leidmiseks kombineerime ENCODE andmestikus olevaid andmeid geenide võimalike regulaatorite ja aktiivsete promootorite kohta. Juhul kui geeni regulatoorses alas on näidatud transkriptsioonifaktori seondumist, siis peame seda võimalikuks signaalivahendajaks peamiselt regulaatorilt. Edasi tuleb leida need potentsiaalsed signaalivahendajad, mis on ise peamise regulaatori poolt otseselt mõjutatud. Töö tulemusena tekivad kolmikud geenidest, kus peamine regulaator reguleerib otseselt signaalivahendajat. See omakorda reguleerib peamise regulaatori sihtmärkgeene teatud bioloogilistel tingimustel. Töö lõppeesmärgiks on kasutatav tööriist, mis võimaldab sobivate sisendandmete ja bioloogiliste tingimuste määramisel automaatselt sellised regulatoorseid kolmikuid leida.The goal of the thesis is to automatically find relations between genes from large heterogeneous experimental data. Depending on the type of the experiment, we can only find out very little about the actual regulation between genes. By combining different experiments we can determine the direct and indirect regulation of genes much more accurately. With gene perturbation experiments we can identify genes, that the perturbed gene affects either directly or indirectly. If this data is combined with chromatin immunoprecipitation data, then we can separate directly affected genes from indirectly affected ones. The aim of this thesis is to find the intermediate regulators that carry the signal from the perturbed gene to the indirectly affected genes. To find these intermediate regulators we combine ENCODE data with possible regulators and active promoters of genes. In case the gene’s regulatory area is shown to bind with a transcription factor, then we consider it a possible signal transmitter from the main regulator. As the end result, we will have regulatory triplets, where main regulator regulates an intermediate signal transmitter, that in return regulates the target gene. The primary target of this thesis is to build a tool, which can find these regulatory triplets automatically given the proper input data.estGeeniregulatsiooni signaali vahendavate geenide automaatne leidmine suuremahulistest eksperimentaalsetest andmetestSystematic approach for finding gene regulation signal mediators from large-scale experimental dataThesis