R-pakett diagnooside vaheliste seoste uurimiseks elukestusanalüüsiga

dc.contributor.advisorIlves, Neeme, juhendaja
dc.contributor.advisorMalk, Maria, juhendaja
dc.contributor.advisorKolde, Raivo, juhendaja
dc.contributor.authorSoodla, Sander
dc.contributor.otherTartu Ülikool. Loodus- ja täppisteaduste valdkondet
dc.contributor.otherTartu Ülikool. Arvutiteaduse instituutet
dc.date.accessioned2025-10-21T07:58:58Z
dc.date.available2025-10-21T07:58:58Z
dc.date.issued2025
dc.description.abstractThe aim of this bachelor's thesis was to create an R software package for investigating effects between medical diagnoses using survival analysis, i.e., statistical methods that analyze the time until the occurrence of a specific event. The developed package, Exposure2OutcomeSurv, works with health databases in the OMOP Common Data Model (CDM) format. The package enables health informatics researchers to investigate whether the occurrence of one diagnosis (exposure) affects the occurrence of another diagnosis (outcome), simultaneously for many different diagnoses. For this purpose, it compares the time to outcome occurrence between patients with the exposure and a control group, matched by gender and age but without the exposure. The package visualizes the probability of outcome occurrence over time, statistically compares the groups, and estimates the magnitude of the outcome risk in one group compared to the other. To enhance user-friendliness, the package includes a Shiny graphical user interface. The package's functionality was demonstrated with a pilot study.
dc.description.abstract Bakalaureusetöö eesmärk oli luua R keele tarkvarapakett diagnooside vaheliste seoste uurimiseks elukestusanalüüsiga ehk statistiliste meetoditega, mis analüüsivad aega mingi uuritava sündmuse toimumiseni. Loodud pakett Exposure2OutcomeSurv töötab rahvusvahelise ühtse andmemudeli (OMOP CDM) vormingus terviseandmebaasidega. Pakett võimaldab terviseinformaatika teadlastel uurida, kas ühe diagnoosi (ekspositsiooni) esinemine mõjutab mõne teise diagnoosi (tulemi) esinemist, ja seda korraga paljudel erinevatel seisunditel. Selleks võrreldakse aega tulemi tekkimiseni ekspositsiooniga patsientide ning neile soo ja vanuse poolest sarnase, kuid ekspositsioonita, kontrollgrupi vahel. Pakett visualiseerib tulemi tekkimise tõenäosust ajas, võrdleb gruppe statistiliselt ning hindab, kui palju suurem või väiksem on tulemi risk ühes grupis võrreldes teisega. Kasutajasõbralikkuse suurendamiseks sisaldab pakett Shiny graafilist kasutajaliidest. Paketi tööd demonstreeriti näidisuuringuga.
dc.identifier.urihttps://hdl.handle.net/10062/116964
dc.language.isoet
dc.publisherTartu Ülikoolet
dc.rights.urihttps://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subjectR-pakett
dc.subjectR package
dc.subjectelukestusanalüüs
dc.subjectCoxi mudel
dc.subjectKaplan-Meieri kõver
dc.subjectKaplan-Meier curve
dc.subjectsurvival analysis
dc.subjectCox model
dc.subject.otherbakalaureusetöödet
dc.subject.otherinformaatikaet
dc.subject.otherinfotehnoloogiaet
dc.subject.otherinformaticsen
dc.subject.otherinfotechnologyen
dc.titleR-pakett diagnooside vaheliste seoste uurimiseks elukestusanalüüsiga
dc.title.alternativeR package for Investigating Effects Between Diagnoses Using Survival Analysis
dc.typeThesis

Failid

Originaal pakett

Nüüd näidatakse 1 - 2 2
Laen...
Pisipilt
Nimi:
Soodla_informaatika_2025.pdf
Suurus:
1.62 MB
Formaat:
Adobe Portable Document Format
Laen...
Pisipilt
Nimi:
tulemused.zip
Suurus:
19.07 KB
Formaat:
Compressed ZIP