R-pakett diagnooside vaheliste seoste uurimiseks elukestusanalüüsiga
Laen...
Kuupäev
Autorid
Ajakirja pealkiri
Ajakirja ISSN
Köite pealkiri
Kirjastaja
Tartu Ülikool
Abstrakt
The aim of this bachelor's thesis was to create an R software package for investigating effects between medical diagnoses using survival analysis, i.e., statistical methods that analyze the time until the occurrence of a specific event. The developed package, Exposure2OutcomeSurv, works with health databases in the OMOP Common Data Model (CDM) format. The package enables health informatics researchers to investigate whether the occurrence of one diagnosis (exposure) affects the occurrence of another diagnosis (outcome), simultaneously for many different diagnoses. For this purpose, it compares the time to outcome occurrence between patients with the exposure and a control group, matched by gender and age but without the exposure. The package visualizes the probability of outcome occurrence over time, statistically compares the groups, and estimates the magnitude of the outcome risk in one group compared to the other. To enhance user-friendliness, the package includes a Shiny graphical user interface. The package's functionality was demonstrated with a pilot study.
Bakalaureusetöö eesmärk oli luua R keele tarkvarapakett diagnooside vaheliste seoste uurimiseks elukestusanalüüsiga ehk statistiliste meetoditega, mis analüüsivad aega mingi uuritava sündmuse toimumiseni. Loodud pakett Exposure2OutcomeSurv töötab rahvusvahelise ühtse andmemudeli (OMOP CDM) vormingus terviseandmebaasidega. Pakett võimaldab terviseinformaatika teadlastel uurida, kas ühe diagnoosi (ekspositsiooni) esinemine mõjutab mõne teise diagnoosi (tulemi) esinemist, ja seda korraga paljudel erinevatel seisunditel. Selleks võrreldakse aega tulemi tekkimiseni ekspositsiooniga patsientide ning neile soo ja vanuse poolest sarnase, kuid ekspositsioonita, kontrollgrupi vahel. Pakett visualiseerib tulemi tekkimise tõenäosust ajas, võrdleb gruppe statistiliselt ning hindab, kui palju suurem või väiksem on tulemi risk ühes grupis võrreldes teisega. Kasutajasõbralikkuse suurendamiseks sisaldab pakett Shiny graafilist kasutajaliidest. Paketi tööd demonstreeriti näidisuuringuga.
Bakalaureusetöö eesmärk oli luua R keele tarkvarapakett diagnooside vaheliste seoste uurimiseks elukestusanalüüsiga ehk statistiliste meetoditega, mis analüüsivad aega mingi uuritava sündmuse toimumiseni. Loodud pakett Exposure2OutcomeSurv töötab rahvusvahelise ühtse andmemudeli (OMOP CDM) vormingus terviseandmebaasidega. Pakett võimaldab terviseinformaatika teadlastel uurida, kas ühe diagnoosi (ekspositsiooni) esinemine mõjutab mõne teise diagnoosi (tulemi) esinemist, ja seda korraga paljudel erinevatel seisunditel. Selleks võrreldakse aega tulemi tekkimiseni ekspositsiooniga patsientide ning neile soo ja vanuse poolest sarnase, kuid ekspositsioonita, kontrollgrupi vahel. Pakett visualiseerib tulemi tekkimise tõenäosust ajas, võrdleb gruppe statistiliselt ning hindab, kui palju suurem või väiksem on tulemi risk ühes grupis võrreldes teisega. Kasutajasõbralikkuse suurendamiseks sisaldab pakett Shiny graafilist kasutajaliidest. Paketi tööd demonstreeriti näidisuuringuga.
Kirjeldus
Märksõnad
R-pakett, R package, elukestusanalüüs, Coxi mudel, Kaplan-Meieri kõver, Kaplan-Meier curve, survival analysis, Cox model