DNA mutatsiooniliste signatuuride õppimine tehisnärvivõrkude abil

dc.contributor.advisorZafra, Raul Vicente
dc.contributor.advisorParts, Leopold
dc.contributor.advisorMatiisen, Tambet
dc.contributor.advisorTampuu, Ardi
dc.contributor.authorTammeveski, Lauri
dc.date.accessioned2017-04-26T07:12:22Z
dc.date.available2017-04-26T07:12:22Z
dc.date.issued2016
dc.description.abstractKõik pahaloomulised vähkkasvajad on põhjustatud organismi rakkudes\n\rtoimuvate mutatsioonide poolt. On leitud, et need mutatsioonid\n\ron moodustatud spetsiifiliste mustrite ehk signatuuride kombinatsioonist,\n\rmille aluseks olevad protsessid on tihti teada. Seetõttu on nende\n\rsignatuuride õppimine andmetest väga tähtis — see võib anda paremat\n\rinformatsiooni vähkkasvajate mehhanismide kohta ja olla abiks\n\rvähi ennetamisel ja teraapial. Antud töö eesmärk on testida ja võrrelda\n\rerinevaid metoodikaid, et parandada mutatsiooniliste signatuuride\n\rleidmist. Me võrdlesime kolme uut meetodit — tehis-närvivõrgud\n\r(NN), mittenegatiivsed faktorvõrgud (RFN) ja teemade modelleerimine\n\r— praegu kasutatava mittenegatiivse maatriksi faktoriseerimisega\n\r(NMF). Me eksperimenteerisime meetoditega kolmel orgaanilisel ja kolmel\n\rsünteetilisel andmestikul ning mõõtsime rekonstrueerimise viga, tulemuse\n\rhõredust ja arvutusteks kulunud aega. Tulemused näitavad, et\n\rNMF annab väikseima veaga tulemuse kergematel andmestikel, kuid ka\n\rRFN-i tulemus on ligilähedane ning kõikidel teistel andmestikel saavutab\n\rsee parema tulemuse. NN esineb sama hästi kui RFN keerulisematel\n\randmestikel ning lisaks saavutab üleüldiselt kõige hõredamad tulemused.\n\rNMF-i eeliseks on stabiilsuse arvutamise funktsionaalsus, mis väga\n\rtäpselt suudab määrata õige signatuuride arvu. Tulevikus tuleb teha\n\redasist arendustööd, et sarnane võimekus ka RFN ja NN meetoditele\n\rlisada, mille järel oleks võimalik nende praktiline kasutamine mutatsiooniliste\n\rsignatuuride õppimisel.
dc.description.abstractAll cancers are caused by mutations in the cells of an organism. It\n\ris found that these mutations result from the combination of specific\n\rmutational signatures, which often have known underlying processes.\n\rThat is why learning these signatures is important — it can give better\n\rinformation about the mechanisms of cancers and also be helpful for\n\rcancer prevention and therapy. The aim of this thesis is to test and\n\rcompare different methodology to improve the discovery of mutational\n\rsignatures. In particular, we compared three new methods of neural\n\rnetworks (NN), rectified factor networks (RFN) and topic modelling\n\rto the currently used non-negative matrix factorization (NMF). We\n\rexperimented with the methods on three organic and three synthetic\n\rdata sets by measuring reconstruction error, sparsity and time taken\n\rand compared them with NMF. The results show that NMF produces\n\rthe smallest error on easier data sets, but error of RFN is comparably\n\rgood also and on all other data sets produces the best result. NN\n\rperforms equally well with RFN on more difficult data sets and overall\n\rproduces the sparsest results. The advantage of NMF is the stability\n\rfunctionality that determines very well the correct number of signatures.\n\rFuture work will be needed to add this capability to RFN and\n\rNN methods which would enable their practical use for the problem of\n\rfinding mutational signatures.
dc.identifier.urihttp://hdl.handle.net/10062/56168
dc.language.isoeng
dc.titleDNA mutatsiooniliste signatuuride õppimine tehisnärvivõrkude abil
dc.title.alternativeLearning DNA mutational signatures using neural networks
dc.typeThesis

Files

Original bundle
Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
thesis.pdf
Size:
4.21 MB
Format:
Adobe Portable Document Format