Browsing by Author "Alasoo, Kaur, juhendaja"
Now showing 1 - 11 of 11
- Results Per Page
- Sort Options
Item Assessment of the suitability of the Estonian Health Record data for the prediction of ischemic stroke(Tartu Ülikool, 2021) Adamson, Ainika; Haller, Toomas, juhendaja; Alasoo, Kaur, juhendaja; Tartu Ülikool. Loodus- ja täppisteaduste valdkond; Tartu Ülikool. Arvutiteaduse instituutAn increase in the instances of cardiovascular diseases has elevated the need for better and more efficient prediction models for ischemic stroke as well. Therefore, it is vitally important to assess the Estonian Health Record laboratory data to find out its suitability for ischemic stroke prediction models. To that effect five different approaches and three methods were utilized in three tiers in this Thesis. The potential of binary statement of measurement facts, as well as the actual analysis results, calculated z-scores and medical reference values were evaluated as the input for prediction models. It was found that the binary statement of measurements itself contained enough information for a competitive prediction model. However, several analytes were identified that had increased the quality of the prediction outcomes and therefore should be studied further.Item Atoopilise dermatiidiga seotud geenide tuvastamine geneetilise kolokalisatsiooni abil(Tartu Ülikool, 2021) Kolberg, Peep; Alasoo, Kaur, juhendaja; Rebane, Ana, juhendaja; Tartu Ülikool. Loodus- ja täppisteaduste valdkond; Tartu Ülikool. Arvutiteaduse instituutAtoopiline dermatiit on pärilik põletikuline nahahaigus. Haiguse tunnusteks on muutused naharakkudes, naha mikrobioomis ja immuunsüsteemi aktiivsuses, kuid pole selge, kuidas need DNA põhjal kujunevad. Genoomiuuringud seostavad geneetilisi variante fenotüüpidega. Kombineerides GWAS ja eQTL analüüside andmestikke on võimalik tuvastada geneetilised variandid, mis seostuvad haigusega ja mõjutavad ka geeniekspressiooni. Mõjutatud geenid mängivad tõenäoliselt rolli haiguse tekkel ja nende signaaliradade uurimine aitab kirjeldada atoopilise dermatiidi molekulaarseid mehhanisme. Bakalaureusetöös kolokaliseeriti andmestikud kahest GWAS uuringust ja 112-st eQTL analüüsist. Haigusega seostati 148 geeni, millest lähemalt vaadati interleukiin-1 tsütokiinide perekonna geenide ekspressiooniandmeid. Välja toodi geenid IL1RL1, IL18, IL18R1, IL18RAP. Tulemused kinnitavad, et interleukiin-1 perekonna valgud mõjutavad atoopilise dermatiidi teket. Tulemused on aluseks edasistele uuringutele konkreetsete geenide panuse kohta haiguses.Item Beetainterferooni signaaliraja aktiivsust mõjutavate geneetiliste variantide tuvastamine(Tartu Ülikool, 2021) Tambets, Ralf; Alasoo, Kaur, juhendaja; Tartu Ülikool. Loodus- ja täppisteaduste valdkond; Tartu Ülikool. Arvutiteaduse instituutBeetainterferoon on inimorganismi põletikuvastuses tähtsal kohal olev biomolekul. See on osa laiast põletikuvastasest geenivõrgustikust, mille toimemehhanism ei ole veel lõplikult selge. Käesolevas töös püüti nelja populatsiooni andmetele tuginedes ülegenoomsete assot-siatsioonuuringute abil tuvastada selle signaaliraja aktiivsust mõjutavaid seni välja selgita-mata geneetilisi variante. Selleks käsitleti beetainterferooni kodeerivas IFNB1 lookuses ole-vaid geneetilisi variante trans-eQTLidena ja selgitati välja nendega kõige tugevamas seoses olev geen. Leitud geeni beetainterferooni signaalraja markergeenina kasutades üritati tuvas-tada täiendavaid signaalraja aktiivsust mõjutavaid trans-eQTLe väljaspool IFNB1 lookust. IFNB1 lookuse seos IFI6 geeniga õnnestus replitseerida nii Fairfax_2014 andmestikus, kus see esmakordselt tuvastati, kui ka ülejäänud kolmel populatsioonil. Lõpliku valimi väiksuse (n=685) tõttu uusi seoseid tuvastada ei õnnestunud.Item Building a catalogue of molecular quantitative trait loci to interpret complex trait associations(2023-10-25) Kerimov, Nurlan; Alasoo, Kaur, juhendaja; Tartu Ülikool. Loodus- ja täppisteaduste valdkondKujutage ette, et olete ruumis, kus on üks laelamp ja sein, mida kaunistavad 100 salapärast lülitit. Nende juhtmed on peidetud ja nende eesmärk jääb mõistatuseks. Otsustate katsetada ja erinevaid lüliteid sisse-välja lülitades süttib järsku lamp. Edasisel erinevate kombinatsioonide katsetamisel märkate lambi heleduse muutumist. Mõne kombinatsiooni puhul põleb lamp eredalt, teiste puhul aga valgustab ruumi hämaralt. Peale mõningast nokitsemist hakkad aru saama, millised lülitite kombinatsioonid lambi heledust kõige enam mõjutavad. Kuid teie lõppeesmärk on lambi heledust täpselt oma äranägemise järgi juhtida. Tundub, et lülitid ise ei tekita elektrivooli. Pigem peavad nad käivitama nähtamatud elektrigeneraatorid. Mõistatus seisneb nüüd konkreetsete lülitite ja konkreetsete generaatorite vaheliste ühenduste väljaselgitamises, mis võimaldavad lambil põleda. Selle metafooriga püüdsin anda lihtsustatud ettekujutuse kvantitatiivse tunnuse lookuste ehk QTL analüüsist. Siin tähistavad lülitid geneetilisi variante, lamp sümboliseerib mõnda inimese mõõdetavat tunnust või haigust, generaatorid tähistavad geene ja ruum tähistab konkreetset rakutüüpi. Selles metafooris tähistab iga QTL konkreetse lüliti mõju ühele või enamale generaatorile. Kuid keerukus ületab kaugelt vaid 100 lülitit. Tegelikult on meil tegemist miljonitega. Ja kuigi lülitid (geneetilised variandid) on igas erinevas ruumis (rakutüüp) identsed, erineb lüliteid generaatoritega (geenidega) ühendav juhtmestike plaan ruumiti oluliselt. Käesolevad doktoritöös olen ma koostöös paljude partneritega loonud ulatusliku QTL-ide andmebaasi, mis hõlmab 127 erinevat inimese rakutüüpi ja kude. Lisaks oleme välja töötanud tööriistad nende QTL-ide paremaks tõlgendamiseks ja visualiseerimiseks. See andmebaas - eQTL Catalogue - on näidanud oma väärtust mitmetes teadusprojektides, parandades meie arusaamist inimese haiguste ja muude tunnuste geneetilistest alustest. Muuhulgas võimaldab meie andmebaasi hästi läbimõeldud ja säilenõtke taristu uute uurimismeetodite ilmnemisel kiiresti algandmeid uuesti analüüsida ja seeläbi kiiresti arenevas genoomiuuringute valdkonnas ajaga kaasas käia.Item Ekspressiooni kvantitatiivsete tunnuste lookuste analüüs üksikraku RNA sekveneerimisandmetes(Tartu Ülikool, 2023) Kolberg, Peep; Alasoo, Kaur, juhendaja; Tartu Ülikool. Loodus- ja täppisteaduste valdkond; Tartu Ülikool. Arvutiteaduse instituutIndiviididevaheline geneetiline variatsioon on rikkalik ning DNA mõju fenotüübile kindlakstegemine keeruline. Selguse toomiseks viiakse läbi uuringuid, kus mõõdetakse inimeste tunnuseid ja kaardistatakse genoom ning nende kahe vahel leitakse põhjuslikke seoseid. Üks mõõdetav tunnus on RNA ekspressioon. Tänapäeval saab RNA ekspressiooni mõõta üksiku raku tasemel, mis loob detailsema pildi rakkude heterogeensusest ja võimaldab luua tugevamaid seoseid genoomiga. Seepärast on üksikraku RNA sekveneerimisandmetega eQTL-analüüs võimas meetod DNA mõju selgitamiseks. Kui aga laborid sooritavad analüüse erisuguste meetoditega, pole publitseeritud tulemused omavahel võrreldavad ega kombineeritavad. Et valimeid maksimaalselt kasutada, peaks andmeid analüüsima üheselt või läbi metaanalüüsi. Lõputöös kasutati andmeid kolmest üksikraku RNA sekveneerimistööst ning näidati, et rakendades kõigile ühte ja sama tegevusahelat, on eQTL-signaalid samamoodi leitavad. Tulemused kinnitavad, et andmestikud sobivad metaanalüüsiks. Kombineerides erinevatest allikatest pärit andmed ja neid koos analüüsides, on suurem statistiline võimsus tuvastada olulisi seoseid.Item Estimating Concordance Between Measured and Predicted Genetic Variant Effects on Chromatin Accessibility(Tartu Ülikool, 2023) Kuningas, Kristiina; Alasoo, Kaur, juhendaja; Tartu Ülikool. Loodus- ja täppisteaduste valdkond; Tartu Ülikool. Arvutiteaduse instituutMany GWAS studies have identified genetic variants associated with human traits or diseases. However, understanding the underlying molecular mechanisms of those associations has been challenging. Chromatin accessibility is one of those traits that has been associated with a higher risk for a disease. If chromatin is not accessible, then transcription factors cannot bind to it and gene expression or protein synthesis cannot be initiated. This can lead to an altered risk for some diseases. Therefore, it is essential to study quantitative trait loci that affect chromatin accessibility (caQTLs). One of the approaches to find genetic variants is caQTL mapping. It uses open chromatin data and genotype imputation to find associations between genetic variants and chromatin accessibility. Additional fine-mapping distinguishes the potentially causal variants. In addition, deep learning models predicting genetic variants’ effects on molecular traits have been integrated into the studies to understand even better the biological mechanisms behind the associations between genetic variants and phenotypic traits. However, the predictive accuracy of these models is still unclear. In this thesis, we created five caQTL datasets for five different cell types based on the fine-mapping results. These datasets were then used to validate the performance of a state-of-the-art deep learning model Enformer in predicting genetic variant effects on chromatin accessibility. Although other studies have evaluated Enformer predictions already, then they have done it from gene expression perspective based on measured effects from RNA-seq data. This thesis, however, compares measured genetic variants’ effects on chromatin accessibility from ATAC-seq data to Enformer’s predicted effects. It compares both the effect size but also the direction of it. It provides an initial overview of how Enformer performs on chromatin accessibility. Results showed that Enformer performs pretty well on especially the variants for which it predicts stronger effects. In addition, it provided expected results when the cell type of a measured variant was different from the cell type of the predicted variant, meaning it had more opposite effects than it would have with a similar cell type. On the other hand, it also showed very low near-zero effect scores in many cases when the measured effect was higher.Item Genetic effects on gene expression across cell types, tissues and biological contexts(Tartu Ülikool, 2020) Peikova, Kateryna; Alasoo, Kaur, juhendaja; Tartu Ülikool. Loodus- ja täppisteaduste valdkond; Tartu Ülikool. Arvutiteaduse instituutThe human body consists of many tissues (e.g. brain, blood, skin or fat) which in turn are made of many different component cell types (e.g. neurons, monocytes, fibroblasts or adipocytes). The identities and functions of different cell types are defined by the different sets of genes that they express. Similarly, genetic differences between individuals can alter gene expression levels and in turn influence one’s risk of developing various complex diseases. Specific genetic variants associated with gene expression levels are referred to as expression quantitative trait loci (eQTLs). While multiple studies have demonstrated that the eQTL effect sizes vary between cell types and tissues, the magnitude of this variation has remained unclear. Although small studies focusing on purified cell types have generally reported large differences in eQTL effect sizes between cell types, the largest analysis of gene expression across 49 human tissues by the GTEx project found a high level of eQTL sharing between tissues. Furthermore, different analytical choices have made it difficult to compare results from different studies. Fortunately, the eQTL Catalogue project has recently released uniformly processed eQTL summary statistics from 19 individual studies. In this thesis, we used the eQTL Catalogue summary statistics to estimate the sharing of eQTLs across up to 46 individual cell types and tissues. Consistent with previous reports, we find high levels of eQTL sharing between tissues. In contrast, there was much less sharing between purified cell types. This suggests that high tissue-level sharing is driven by sharing of cell types between tissues and averaging of effect sizes across many different component cell types. This was further supported by factor analysis, which revealed that eQTL effect sizes in tissues were comprised of multiple shared and cell-type-specific components. Finally we tried use the cell-type-specific eQTL components to interpret complex disease associations, but did not find compelling evidence for specific enrichments. Our results indicate that much larger datasets from purified cell types are needed to completely interpret eQTL signals detected in complex tissues.Item Haiguste geneetiliste korrelatsioonide arvutamine LD-skoori regressiooni meetodiga(Tartu Ülikool, 2021) Saarse, Kermo; Alasoo, Kaur, juhendaja; Kronberg, Jaanika, juhendaja; Tartu Ülikool. Loodus- ja täppisteaduste valdkond; Tartu Ülikool. Arvutiteaduse instituutGeneetiline korrelatsioon on suurus, mis võimaldab hinnata kahe või enama haiguse ühist geneetilist algpõhjust. Selles töös kasutatakse Tartu Ülikooli Geenivaramu andmete peal LD-skoori regressiooni meetodit, mis võimaldab geneetilisi korrelatsioone arvutada ülegenoomsetest assotsiatsiooniuuringutest saadud andmete põhjal. Töö käigus tuli välja, et suur osa andmetest ei sobinud meetodi jaoks ning edukalt arvutatud korrelatsioonide seast osutusid väga vähesed statistiliselt oluliseks. Kui neid geneetilisi korrelatsioone võrreldi suhteliste riskidega, ilmnes positiivne korrelatsioon. Seega on töö põhisõnum see, et edaspidi tuleb taolistes uuringutes kasutada suuremaid valimeid.Item Pleiotroopia roll geeniekspressiooni regulatsioonis(Tartu Ülikool, 2021) Jukk, Pilleriin; Alasoo, Kaur, juhendaja; Tartu Ülikool. Loodus- ja täppisteaduste valdkond; Tartu Ülikool. Arvutiteaduse instituutGeeniekspressioon on protsess, mille käigus avaldatakse geenides sisalduv pärilik materjal RNA või valguna. Uurides geeniekspressiooni on võimalik tuvastada haiguse põhjustajaid ja välja töötada neile sobilikke ravimeetodeid. Küll aga ei ole geeniekspressiooni regulatsioon spetsiifiline. See tähendab, et leidub pleiotroopsust ehk üks geneetiline variant mõjutab mitut tunnust korraga. Lisaks, kuna läheduses asuvad geneetilised variandid on omavahel korreleeritud, siis saadakse selliste uuringute tulemuseks mitmeid tunnusega tugevalt seotud variante, millest on aga keeruline järeldusi teha. Töö eesmärk oli välja selgitada, kuidas mõjutab horisontaalne pleiotroopsus geeniekspressiooni regulatsiooni. Selleks analüüsiti geeniekspressiooni ja transkriptsiooni täppiskaardistamise tulemusi (Kerimov et al., 2020) ning võrreldi, kas mõne protsessi puhul olid variandid seotud vähemate geenidega kui geeniekspressiooni puhul. Leiti, et kõigi nelja uuritud protsessi – transkriptide valiku, RNA splaissimise, promootori ja terminaatori kasutuse – uurimistulemused on oluliselt spetsiifilisemad kui geeniekspressiooni omad. Uurimistulemustest saab järeldada, et põhjuslike geenide väljaselgitamiseks tuleks esmalt hakata uurima transkriptide valikut, RNA splaissimist, promootori ja terminaatori kasutust mõjutavaid variante, sest nende protsesside puhul leidub vähem horisontaalset pleiotroopiat ja seega on nende uurimistulemused täpsemad. Nende protsesside puhul on seetõttu ka lihtsam välja selgitada, läbi millise geeni põhjuslik variant haigust mõjutab.Item Predicting the molecular mechanisms of genetic variants(Tartu Ülikool, 2024) Yarish, Dzvenymyra-Marta; Alasoo, Kaur, juhendaja; Tartu Ülikool. Loodus- ja täppisteaduste valdkond; Tartu Ülikool. Arvutiteaduse instituutHaiguste mehhanismide avastamiseks ja uute ravimisihtmärkide prioritiseerimise hõlbustamiseks on vaja paremini mõista neid molekulaarseid mehhanisme, mille kaudu geneetiliste variandid mõjutavad haiguseid ja teisi komplekstunnuseid. Tavaliselt kasutatakse variantide toimemehhanismide väljaselgitamiseks molekulaarsete kvantitatiivse tunnuse lookuste (ingl k molecular quantitative trait locus, molQTL) uuringud, mis peaksid aitama tuvastada, kas konkreetne geneetiline variant mõjutab RNA splaissimist (sQTL) või geeniekspressiooni (eQTL). Kahjuks ei suuda aga molQTL meetodid täpselt vahet teha splaissimise ja geeniekspressiooni mehhanismidel ning lisaks ei ole neil võimekust tuvastada haruldaste variantide mõju. Nende puuduste ületamiseks uurisime, kas ja kuidas oleks võimalik kasutada masinõpet variantide toimemehhanismide ennustamiseks. Esmalt koostasime me käsitsi kureeritud treeningandmestiku, milles olid kahte tüüpi molQTLid: splaissimist mõjutavad sQTLid ja läbi kromatiini avatuse geeniekspressiooni mõjutavad eQTLid. Seejärel võrdlesime kahe süvanärvivõrgumudeli (Enformer ja ChromBPNet) võimet ennustada geneetilise variandi mõju kromatiini avatusele ja leidsime, et ChromBPNet mudeli ennustused olid üldiselt täpsemad. Järgmiseks töötasime välja geneetilise variandi toimemehhanismi ennustamise mudeli, mis ühendas endas klassikalised genoomiülesed tunnused erinevate süvaõppemudelite ennustustega. See mudel saavutas sQTL ja eQTL klasside eristamisel peaaegu 90% täpsuse, ületades märgatavalt ühe suure alusmudeli skooridel põhineva klassifikaatori 80%-list täpsust. Viimaks rakendasime toimemehhanismi ennustamise mudelit eQTL Catalogue andmebaasis olevat QTLid klassifitseerimiseks. Meie mudeli ennustused olid hästi kooskõlas geeniekspressiooni QTL-idega, kuid enamikku Leafcutteri meetodi poolt tuvastatud võimalikke splaissimise seoseid ei klassifitseeritud sQTL-ideks. Käesoleva töö käigus loodud uudne andmekogum ja esialgne masinõppemudel võimaldavad tulevikus paremini ennustada haigusseoseliste geneetiliste variantide toimemehhanisme.”Item Valimi suuruse mõju ekspressiooni kvantitatiivsete tunnuste lookuste täppiskaardistamisele lümfoblastoidrakuliinides(Tartu Ülikool, 2021) Kuklane, Anette Maria; Alasoo, Kaur, juhendaja; Tartu Ülikool. Loodus- ja täppisteaduste valdkond; Tartu Ülikool. Arvutiteaduse instituutInimese genoomis leiduvad kodeerivad osad, mida nimetatakse geenideks. Geenides olevate geneetiliste variantide järjestuste põhjal sünteesitakse geeniekspressiooni käigus valke, mis määravad ära organismi fenotüübi. Geeniekspressiooni mõjutavad geneetilised variandid asuvad ekspressiooni kvantitatiivsete tunnuste lookustes ja avaldavad valgusünteesi kaudu olulist mõju tunnuste, sealhulgas haiguste ja häirete, avaldumisele. Sageli on taoliste haigusi ja häireid põhjustavate variantide tuvastamine ning nende poolt mõjutatavatest geneetilistest mehhanismidest arusaamine variantide omavahelise korrelatsiooni tõttu keeruline. Kasutades täppiskaardistamist, on võimalik süstemaatiliselt hinnata geneetiliste variantide põhjuslikkuse tõenäosust, leides tunnuse signaalile vastavalt vähemalt ühte põhjuslikku varianti sisaldavad usaldusväärsete variantide hulgad. Senini ei ole aga uuritud valimi suuruse mõju täppiskaardistamise täpsusele põhjuslike variantide leidmisel. Siinse bakalaureusetöö eesmärk oli uurida, kuivõrd suuremate valimite kasutamine võimaldab tõsta statistilist usaldusväärsust põhjuslike variantide leidmisel lümfoblastoidrakuliinides. Töö käigus leiti, et valimi suurenedes muutub täppiskaardistamine täpsemaks, kuna suureneb nii statistiline usaldusväärsus põhjuslike variantide leidmisel kui ka statistiline võimsus põhjuslikke variante sisaldavaid usaldusväärsete variantide hulkasid tuvastada. Täpsemalt leiti suuremate valimite korral rohkem täppiskaardistatud usaldusväärsete variantide hulkasid, mis sageli sisaldasid väiksemal hulgal tõenäoliselt põhjuslikke variante.