R Package for Describing Medical Cohorts

dc.contributor.advisorMooses, Kerli, juhendaja
dc.contributor.authorRosenberg, Karin
dc.contributor.otherTartu Ülikool. Loodus- ja täppisteaduste valdkondet
dc.contributor.otherTartu Ülikool. Arvutiteaduse instituutet
dc.date.accessioned2025-10-21T06:36:34Z
dc.date.available2025-10-21T06:36:34Z
dc.date.issued2025
dc.description.abstractThe use of standardized health data enables a better understanding of patient treatment, diagnosis, and service utilization patterns and supports data-driven decision-making in healthcare. The aim of this thesis was to develop a workflow and an interactive application for describing cohorts based on health data presented in the OMOP CDM format, with a focus on characterizing cohorts through ICD-10 codes. Reliable cohort analysis requires a precisely defined and clearly described cohort, which is facilitated by providing a comprehensive overview of the cohort’s characteristics — supported by the use of the developed tool CohortExplorerICD. Using the application, it is possible to define primary and comorbid diagnoses based on the International Classification of Diseases, apply filters by gender, age, and time intervals, and analyze statistical indicators of patients belonging to the selected cohort. The application adheres to data protection and accessibility principles: results are not displayed when the data set includes five or fewer individuals and visualization uses color schemes suitable for color-blind users. The developed tool enables users to explore the characteristics of the selected patient group through interactive charts, providing visualizations related to diagnoses, age distribution, mortality, and service utilization.
dc.description.abstract Standardiseeritud terviseandmete kasutamine võimaldab senisest paremini mõista patsientide ravi-, diagnoosi- ja teenusekasutuse mustreid ning toetada tervishoius andmepõhist otsustamist. Lõputöö eesmärk oli arendada töövoog ja interaktiivne rakendus, mis võimaldab kirjeldada kohorte OMOP CDM formaadis esitatud terviseandmetel rahvusvaheliste haiguste klassifikatsiooni koodide kaudu. Usaldusväärne kohortanalüüs eeldab täpselt määratletud ja selgelt kirjeldatud kohorti, mille saavutamisele aitab kaasa põhjalik ülevaade kohordi koosseisust ja omadustest — seda toetab arendatud tööriista kasutamine. Töös loodud paketi CohortExplorerICD abil saab määratleda esmaseid ja kaasuvaid diagnoose rahvusvahelise haiguste klassifikatsiooni alusel, rakendada filtreid soo, vanuse ja ajavahemike lõikes ning analüüsida valitud kohorti kuuluvate patsientide statistilisi näitajaid. Rakenduses on arvestatud andmekaitse- ja ligipääsetavuse põhimõtetega: tulemusi ei kuvata, kui andmehulgas on viis või vähem inimest, ning visualiseerimisel on kasutatud värviskeeme, mis sobivad ka värvipimedatele kasutajatele. Valminud tööriist võimaldab kasutajatel uurida valitud patsientide rühma omadusi interaktiivsete jooniste kaudu, pakkudes visuaale diagnooside, vanusejaotuse, suremuse ja meditsiiniteenuste kasutuse kohta.
dc.identifier.urihttps://hdl.handle.net/10062/116947
dc.language.isoen
dc.publisherTartu Ülikoolet
dc.rights.urihttps://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subjectR programming language
dc.subjectshiny
dc.subjectcohort description
dc.subjectOMOP CDM
dc.subjectvisualization
dc.subjectvisualiseerimine
dc.subjectProgrammeerimiskeel R
dc.subjectkohordi kirjeldamine
dc.subject.otherbakalaureusetöödet
dc.subject.otherinformaatikaet
dc.subject.otherinfotehnoloogiaet
dc.subject.otherinformaticsen
dc.subject.otherinfotechnologyen
dc.titleR Package for Describing Medical Cohorts
dc.title.alternativeR-pakett meditsiiniliste kohortide kirjeldamiseks
dc.typeThesis

Failid

Originaal pakett

Nüüd näidatakse 1 - 1 1
Laen...
Pisipilt
Nimi:
ba2025_Rosenberg.pdf
Suurus:
1.91 MB
Formaat:
Adobe Portable Document Format