Browsing by Author "Adler, Priit"
Now showing 1 - 3 of 3
Results Per Page
Sort Options
Item Analysis and visualisation of large scale microarray data(2015-07-06) Adler, PriitViimase paari aastakümne jooksul on genereeritud hulgaliselt suuremahulisi geeniekspressiooni andmestikke. Sellised andmestikud on hinnalised ja neid säilitatakse suurtes andmebaasides nagu näiteks GEO või Arrayexpress. Geenide, valkude, metaboliitide ja ensüümide omavahelised koostoimimised ja reaktsioonid on kokku kogutud ja süstematiseeritud bioloogiliste radade andmebaasidesse nagu KEGG ja Reactome. Suuremahuliste ekspressiooniandmete ja bioloogiliste radade ühildamine võimaldab kirjeldatud protsesse paremini analüüsida ja mõista. Väitekiri kirjeldab KEGGanim tööriista, mis ühildab suuremahulised geeniekspressiooni andmestikud ja KEGG bioloogiliste radade pildid. Tööriist loob interaktiivse animatsiooni üle erinevate eksperimendi tingimuste, võimaldades jälgida ajalist või tingimuslikku ja ruumilist ekspressiooni dünaamikat. Sellised animatsioonid sobivad kasutamiseks konverentsi ettekannetes, veebis või ka publikatsioonides. Suurt hulka avalikke geeniekspressiooni andmestikke on võimalik ära kasutada, et tuvastada uusi vastasmõjusid geenide vahel üle paljude bioloogiliste tingimuste. Selline analüüs võimaldab tuvastada ühiseid regulatoorseid mehhanisme, ühiseid funktsioone või rolle sarnastes bioloogilistes protsessides. Me oleme arendanud metoodika, mis võimaldab teha päringupõhist koos-ekspressiooni analüüsi üle sadade avalike geeniekspressiooni andmestike. Geenide koos-ekspressioon arvutatakse igas andmestikus eraldi ja tulemused koondatakse kokku ühiseks järjestatud nimekirjaks kasutades astakute agregeerimise meetodit. Selline lähenemine teeb võimalikuks hõlpsalt taaskasutada juba olemasolevaid geeniekspressiooni andmestikke ja tuvastada signaale, mida oleks keeruline leida analüüsides üksikuid andmestikke eraldi. Implementeeritud Multi Experiment Matrix (MEM) tööriist võimaldab interaktiivset andmete visualiseerimist ja pakub erinevaid võimalusi leitud tulemuste edasiseks analüüsiks. Arendatud astakute agregeerimise meetodit saab edukalt kasutada ka teistes meta-analüüsides, kus ühildatakse erinevatest allikatest pärit bioloogilisi andmestikke.Item Avalike RNA-Seq andmete taaskasutamine(2015) Tasa, Tõnis; Adler, Priit"Järgmise põlvkonna sekveneerimismeetodid"(NGS) on geeniandmete analüüsil kiiresti populaarsust kogumas. RNA-Seq on NGS tehnika, mis võimaldab geeniekspressiooni tasemete hindamist. Eksperimentidest kogutuid andmeid arhiveeritakse jõudsalt avalikesse andmebaasidesse, kuna toorandmete neisse edastamine on üheks eeltingimuseks akadeemilistes ajakirjades avaldamiseks. RNA-Seq toorandmed on mahult üsna suured ja üksikute eksperimentide analüüs üsnagi aeganõudev. Sekveneerimise toorandmeid taaskasutatakse praegu veel üsna vähe. Andmebaasidesse leiduvate andmete taaskasutamisele avaldavad pärssivat mõju ebatäpsed katseplaneerimise kirjeldused ja kindlate standardite puudumine analüüsimeetodites. Tööriistade vahelised algoritmilised eripärad tähendavad erinevatel meetoditel teostatud analüüside vähest võrreldavust. Lihtne kollektsioonide agregeerimine ei tööta, kuna analüüsitud andmed pole võrreldavad. Seega tuleb analüüs kõikide eksperimentide jaoks teostada alates toorandmetest. Iga eksperimendi analüüs on aga üsna aeganõudev ning nõuab kuldsete standardite puudumisel konkreetseid valikuid. Suuremahuliste analüüsiandmete kollektsiooni nõuab seega efektiivset töövoo implementatsiooni. Toimimise tingimusteks on minimaalne inimsekkumine, fikseeritud tööriistade valik ja robustne eksperimentide käsitsemismetoodika. Väga erinevates tingimustes teostatud eksperimentide ekspressiooniandmete agregeerimine loob võimaluse andmekaeve meetodite rakendamiseks. Lokaalselt ilmnevad mustrid võivad taustsüsteemis osutuda signaaliks. Üheks analüüsivallaks, mis selliseid mustreid uurib on koekspressioonianalüüs. Selles magistritöös arendasime ja implementeerisime raamistiku suuremahuliseks avalike RNA-Seq andmete analüüsiks. Analüüs ei vaja eksperimentide analüüsimisele eelnevalt konfiguratsioonifaili vaid toetub ühekordselt konstrueeritud andmebaasile. Kasutajapoolne sekkumine on minimaalne, kõik parameetrid määratakse andmetest lähtuvalt. See võimaldab järjestikulist analüüsi üle arvukate eksperimentide. Loodavat RNA-Seq ekspressiooniandmete kollektsiooni kasutatakse sisendina BIIT töörühma poolt arenda- tud koekspressiooni uurimise tööriistas - MEM. Algselt oli see ehitatud üksnes mikrokiip andmetelt sondide koekspressiooni hindamiseks, kuid RNA-Seq ekspressiooniandmed laiendavad selle rakendusampluaad.Item Geeniekspressiooni andmete analüüsi meetodi Barcode kirjeldus ja rakendamine(2016) Tars, Sander; Ufliand, Anna; Adler, PriitKäesoleva bakalaureusetöö peamised eesmärgid on üle kontrollida, kas\n\rgeeniekspressiooni andmete analüüsi meetod Barcode täiustab meetodit fRMA ja tuua\n\rerinevused visuaalselt välja.\n\rEsimene, kirjeldav osa keskendub geeniekspressiooni andmete analüüsi meetodil Barcode.\n\rBarcode'i kirjelduse käigus antakse ülevaade erinevatest Barcode'i versioonidest. Iga\n\rversiooni juures on kirjeldatud funktsionaalsused ja nende kasutamine. Põhirõhk on seejuures\n\rpandud uutele funktsionaalsustele võrreldes varasemate versioonidega.\n\rTeises, praktilises osas võrreldakse meetodeid Barcode ja fRMA (fRMA meetodi väljund\n\ron Barcode analüüsi alguspunkt). Nende kahe meetodi võrdlemiseks kasutatakse\n\rinimese geeniekspressiooni andmehulka DNA kiibi eksperimentidest. Andmehulk tähisega\n\rE-TABM-145 sisaldab 158 inimese koenäidise ekspressiooniandmeid. Kõigepealt jaotatakse\n\rneed koenäidised manuaalselt gruppidesse. Need manuaalselt loodud grupid on\n\raluseks mõlema meetodi töö hindamisele. Seejärel töödeldakse algseid andmeid nii meetodiga\n\rBarcode kui ka meetodiga fRMA. Mõlema meetodi tulemuste visualiseerimiseks\n\rja võrdlemiseks kasutatakse eraldi kahte statistilist meetodit: peakomponentanalüüs (principal\n\rcomponent analysis) ja hierarhiline klasterdamine. Mõlema statistilise meetodi\n\rväljunditele on tehtud analüüs ja võrdlus Barcode'i ja fRMA vahel. Vastavate statistiliste\n\rmeetodite väljundite võrdlusest saab järeldada, et Barcode on tõepoolest täiendab\n\rfRMA-d. Barcode võimaldab koenäidiseid apremini õigetesse klastritesse klassifitseerida -\n\rnäidised, mis tulevad samast koest on kasutades Barcode'i paremini ülejäänud näidistest\n\reraldatud kui fRMA puhul.