Browsing by Author "Saarse, Kermo"
Now showing 1 - 2 of 2
- Results Per Page
- Sort Options
Item Haiguste geneetiliste korrelatsioonide arvutamine LD-skoori regressiooni meetodiga(Tartu Ülikool, 2021) Saarse, Kermo; Alasoo, Kaur, juhendaja; Kronberg, Jaanika, juhendaja; Tartu Ülikool. Loodus- ja täppisteaduste valdkond; Tartu Ülikool. Arvutiteaduse instituutGeneetiline korrelatsioon on suurus, mis võimaldab hinnata kahe või enama haiguse ühist geneetilist algpõhjust. Selles töös kasutatakse Tartu Ülikooli Geenivaramu andmete peal LD-skoori regressiooni meetodit, mis võimaldab geneetilisi korrelatsioone arvutada ülegenoomsetest assotsiatsiooniuuringutest saadud andmete põhjal. Töö käigus tuli välja, et suur osa andmetest ei sobinud meetodi jaoks ning edukalt arvutatud korrelatsioonide seast osutusid väga vähesed statistiliselt oluliseks. Kui neid geneetilisi korrelatsioone võrreldi suhteliste riskidega, ilmnes positiivne korrelatsioon. Seega on töö põhisõnum see, et edaspidi tuleb taolistes uuringutes kasutada suuremaid valimeid.Item Tervisesündmuste üldistamine sõnavektorite abil(Tartu Ülikool, 2024) Saarse, Kermo; Reisberg, Sulev, juhendaja; Tartu Ülikool. Loodus- ja täppisteaduste valdkond; Tartu Ülikool. Arvutiteaduse instituutIn the electronic health record, each visit to doctor could generate multiple data points. The same health issue could be linked to multiple diagnoses, drug prescriptions and measurements that are all separate events. Such a high resolution of the data makes its analysis difficult. In this thesis, word2vec model and K-means clustering are used to aggregate related health events into generalised events in an OMOP CDM dataset. It is shown that word2vec can successfully identify related events. As the number of clusters grows, each cluster becomes more homogenous, but there will also be a higher number of similar clusters. As a result of generalization, the number of events in a patient’s dataset decreased significantly.