Browsing by Author "Reisberg, Sulev, juhendaja"
Now showing 1 - 13 of 13
- Results Per Page
- Sort Options
Item Andmete üldistamisel põhineva anonüümimise kvaliteedi hindamine(Tartu Ülikool, 2022) Tavits, Joosep; Reisberg, Sulev, juhendaja; Tartu Ülikool. Loodus- ja täppisteaduste valdkond; Tartu Ülikool. Arvutiteaduse instituutIsikuandmete väljastamisel kolmandatele osapooltele tuleb tagada andmetes sisalduvate isikute kaitse. Levinud meetodiks on sel juhul kasutada andmete anonüümimist, mille tulemusel ei ole üksikisikud andmestikus enam tuvastatavad. Lisaks viimastel aastakümnetel avaldatud erinevatele anonüümimismeetoditele on publitseeritud ka hulgaliselt erinevaid anonüümimise kvaliteedi hindamise mõõdikuid. Seetõttu ei ole nende mõõdikute seast valikute tegemine ilma valdkonna ekspertteadmisteta triviaalne. Selles bakalaureusetöös käsitletakse andmete anonüümimist ja selle kvaliteedi mõõtmist ühe tüüpilise tihedalt andmeväljastustega kokku puutuva organisatsiooni vaatest. Töö raames tuvastatakse kasutatavate anonüümimismeetodite ja lõppkasutaja kirjelduse põhjal sobiv alamhulk anonüümimise kvaliteedi mõõdikud. Seejärel realiseeritakse need mõõdikud olemasoleva anonüümimistarkvara väljundi analüüsimise komponendina, et kirjeldada anonüümimise tulemusel alles jäänud riske ja andmestikus toimunud muudatusi.Item Designing a Pharmacogenetic Test as a Medical Software Device(Tartu Ülikool, 2021) Luik, Taavi; Reisberg, Sulev, juhendaja; Jääger, Kersti, juhendaja; Tartu Ülikool. Loodus- ja täppisteaduste valdkond; Tartu Ülikool. Arvutiteaduse instituutMost people have genetic mutations which influence the efficacy of drugs and when taken into account, could improve health response. A pharmacogenetic test performed on the patient’s genetic data is a possible solution. Although the test merely provides a software-based analysis of already existing genetic data, the test still classifies as a medical software device. This thesis gives an overview of pharmacogenetics, software-based medical devices, formulates requirements for such a device, provides a high level design, verifies the design against requirements, and discusses the results and perspectives.Item Geeniandmete infosüsteemi testimine Cypress raamistikus(Tartu Ülikool, 2021) Sokk, Janne; Reisberg, Sulev, juhendaja; Tartu Ülikool. Loodus- ja täppisteaduste valdkond; Tartu Ülikool. Arvutiteaduse instituutTöös antakse ülevaade arendamisel olevast riiklikust geeniandmete infosüsteemist ja tarkvara testimisest. Esitatakse plaan geeniandmete infosüsteemi testimise korraldamiseks, luuakse selle alusel X-tee liidese automaattestid manuaalse testimise vähendamiseks ja integreeritakse GitLab arenduskeskkonda. Töös kirjeldatakse ja kasutatakse Cypress raamistikku. Lisaks sisaldab töö analüüsi tehtud tööst ning arutelu edasiste tegevuste üle.Item Generalising health events by using frequent itemset mining(Tartu Ülikool, 2024) Suik, Oliver-Erik; Reisberg, Sulev, juhendaja; Tartu Ülikool. Loodus- ja täppisteaduste valdkond; Tartu Ülikool. Arvutiteaduse instituutTerviseandmete digiteerimine on võimaldanud viia läbi uuringuid, mis on parandanud tervishoiupraktikaid ja teinud kliinilisi protsesse tõhusamaks. Siiski on tervishoiu infot patsiendi terviseseisundi hindamisel ja andmepõhistel meetoditel raske kasutada, kuna info on oma olemuselt väga hõre ja mitmekesine. Selle uurimistöö peamine eesmärk on kasutada sagedasi andmehulkasid tervisesündmuste üldistamiseks kõrgemal tasemel sündmuseks ning hinnata nende rakendatavust ja piiranguid. Töö käigus leitakse Eesti terviseandmetest FP-Max algoritmi kasutades sagedased terviseandmete hulgad. Need hulgad klasterdatakse kõrgema taseme sündmusteks, mida kasutatakse selleks, et teha patsientide terviseündmuste ajajoon üldisemaks. Erinevate parameetritega eksperimenteerimise tulemusena tekkisid erineva üldistustasemega klastrid, mis aitasid luua üldistatud pildi patsiendi terviseseisundist, vähendades sündmuste arvu.Item Pidevate tervisenäitajate kaugeleulatuv ennustamine(Tartu Ülikool, 2024) Lepmets, Belinda; Reisberg, Sulev, juhendaja; Tartu Ülikool. Loodus- ja täppisteaduste valdkond; Tartu Ülikool. Arvutiteaduse instituutThis bachelor’s thesis explores the possibility and methodology of creating a model for predicting continuous health measurements over a long-term period using short-term health data. To achieve this, a similarity-based prediction model was developed, relying on a short-term observation window dataset containing measurements from numerous patients. The most similar patient is selected based on initial parameters, and step-by-step progression through their and other patients’ data forms the basis for long-term prognosis. This model was demonstrated using four test cases: height, weight, pulse, and systolic blood pressure, utilizing data from the RITA-MAITT and ELIKTU studies. The height prediction model showed the highest predictive accuracy among these test cases, with an average error of 5.5 cm for model testing and 5.1 cm for the “average of three predictions” model. While this approach may not be suitable for predicting all continuous health measurements, it yields sufficiently accurate results for certain indicators, thus warranting further refinement and investigation of the method.Item Privaatsust tagavad anonüümimistarkvarad(Tartu Ülikool, 2022) Alikas, Allan; Reisberg, Sulev, juhendaja; Tartu Ülikool. Loodus- ja täppisteaduste valdkond; Tartu Ülikool. Arvutiteaduse instituutLõputöö eesmärk on võrrelda üldistamisel põhinevaid anonüümimistarkvarasid, et võtta neist sobivaim kasutusele Health Sense projektis. Võrdlusse kaasati kolm tarkvara: ARX, Amnesia ja Anonimatron. Võrdlus viidi läbi 10 hindamiskriteeriumi alusel, millest osad pärinevad ISO-9421 standardist ja osad tulenevad Health Sense projekti vajadustest. Võrdluse läbiviimiseks loodi 3 komplekti testandmeid, mida kasutati anonüümimisel sisendina. Sobivaimaks tarkvaraks osutus ARX, mis integreeriti Health Sense projektis valmivasse tarkvarakomplekti.Item Process mining on Estonian healthcare data(Tartu Ülikool, 2023) Salamov, Musa; Milani, Fredrik, juhendaja; Reisberg, Sulev, juhendaja; Tartu Ülikool. Loodus- ja täppisteaduste valdkond; Tartu Ülikool. Arvutiteaduse instituutNowadays, healthcare information is recorded and stored electronically in most countries. Data-driven methods, such as process mining, can be used for analyzing healthcare processes by utilizing electronic health records. However, despite its potential, process mining has not been applied to healthcare settings in Estonia. Therefore, this thesis aims to assess the feasibility of process mining for Estonian healthcare data. Additionally, it researches what are the limitations and suggests improvement ideas. To achieve this objective, cervical cancer screening-related health records were analyzed using Apromore. The main results of this thesis are the list of applicable process mining use cases within the context, their limitations and a set of improvement suggestions. Thus, the contribution of this thesis is beneficial for experts and researchers who are involved in the application of process mining in the healthcare domain.Item Psühhoosi prodroomi sümptomite eraldamine meditsiinitekstidest treeningandmestike loomiseks(Tartu Ülikool, 2024) Agu, Kristel; Reisberg, Sulev, juhendaja; Sirts, Kairit, juhendaja; Tartu Ülikool. Loodus- ja täppisteaduste valdkond; Tartu Ülikool. Arvutiteaduse instituutThe current master thesis aimed to create three annotated training datasets for the extraction of psychosis prodromal symptoms from medical texts using semi-automatic methods. For this purpose, a dataset of medical documents from 10% randomly selected Estonian population in the years 2012-2019 was used. These documents were filtered by the ICD-10 diagnoses evident during psychosis prodrome (2780 texts) and split into sentences (31 009) for simplification of the further workflow. A dataset was created from the sentences, which were filtered using a regular expression and annotated manually by the author, and used to train an initial logistic regression model. To create the features for the logistic regression model, word embeddings were found for each word in a sentence using the Word2Vec model pre-trained on the Estonian Reference Corpus and an average embedding was calculated for the whole sentence. After that, an iterative process was initiated, where more sentences containing the symptom were predicted from the remaining data, annotated by the author, added to the existing dataset and repeated until the model finds no new sentences. Using the logistic regression model for the extraction of psychosis prodromal symptoms simplified the dataset creation process and reduced the amount of work put into searching the sentences manually. As a result of this master thesis, an annotated training dataset with 799 sentences for extracting the psychosis prodrome symptom “odd behaviour”, a dataset with 643 sentences for the symptoms “depersonalization” and/or “derealization” and a dataset with 1176 sentences for the symptoms “paranoid delusions” and/or “suspiciousness” were created.Item Ravimite täiendavate riskivähendamise meetmete rakendamise analüüsi automatiseerimine(Tartu Ülikool, 2021) Jäe, Raili; Reisberg, Sulev, juhendaja; Tamm, Sirli, juhendaja; Tartu Ülikool. Loodus- ja täppisteaduste valdkond; Tartu Ülikool. Arvutiteaduse instituutTöös kasutatakse kolme riikliku terviseandmekogu (retseptikeskus, Eesti Haigekassa andmekogu, tervise infosüsteem) 2012.-2019. aasta andmete alusel koostatud ja OMOP CDM mudeli kujule viidud ühendandmekogu, mille 10% juhuvalimi põhjal analüüsitakse, kuidas rakendatakse tervishoiutöötajate poolt ravimite täiendavaid riskivähendamise meetmeid. Töös täiendatakse vastavat analüüsi metoodikat ning realiseeritakse analüüs agomelatiini näitel taaskäivitatava R Markdown analüüsidokumendina. Loodud analüüsikoodi saab rakendada teiste sarnaste täiendavates riskivähendamise meetmetes toodud nõuete rakendamise analüüsimiseks. Tulemused näitasid, et toimeaine agomelatiin täiendavates riskivähendamise meetmes toodud nõudeid täidetakse pigem harva. Kõik täiendavates riskivähendamise meetmetes ettenähtud maksafunktsiooni mõõtmise analüüsid tehti kauem kui 180 päeva kestnud ravi korral vaid 2% kohorti kuulunud patsientidele. Vähemalt üks maksaensüümide mõõtmise analüüs oli enne ravi või ravi ajal tehtud 56%-le kõikidest agomelatiini patsientidest.Item Terviseandmete tabeli veergude automaatne tüübituvastus(Tartu Ülikool, 2022) Mumm, Kristina; Reisberg, Sulev, juhendaja; Tartu Ülikool. Loodus- ja täppisteaduste valdkond; Tartu Ülikool. Arvutiteaduse instituutKäesoleva töö eesmärgiks on luua automatne veergude tüübi tuvastamise komponent projekti Health Sense raames loodavale terviseandmete anonüümimise tarkvarale. Täpsemalt keskendub komponent terviseandmetele, mis sisaldavad sageli kategoorilisi andmeid. Tüübi tuvastamise protsess jagati kolmeks osas. Regulaaravaldiste abil leitakse, milliste andmetüüpide struktuuriga veeru väärtused sobivad. Seejärel kontrollitakse veeru väärtuste vastavust leitud andmetüüpide lubatud väärtuste loendiga. Viimases sammus valitakse sobivatest andmetüüpidest kõige sobilikum. Lisaks analüüsitakse töös Eesti terviseandmeid, et aru saada, kas terviseandmetes esinevad vead võivad olla probleemiks tüübi tuvastamise juures.Item Tervisesündmuste üldistamine sõnavektorite abil(Tartu Ülikool, 2024) Saarse, Kermo; Reisberg, Sulev, juhendaja; Tartu Ülikool. Loodus- ja täppisteaduste valdkond; Tartu Ülikool. Arvutiteaduse instituutIn the electronic health record, each visit to doctor could generate multiple data points. The same health issue could be linked to multiple diagnoses, drug prescriptions and measurements that are all separate events. Such a high resolution of the data makes its analysis difficult. In this thesis, word2vec model and K-means clustering are used to aggregate related health events into generalised events in an OMOP CDM dataset. It is shown that word2vec can successfully identify related events. As the number of clusters grows, each cluster becomes more homogenous, but there will also be a higher number of similar clusters. As a result of generalization, the number of events in a patient’s dataset decreased significantly.Item The Process of Creating a Scientific Knowledge Base for Pharmacogenetic Testing(Tartu Ülikool, 2021) Orula, Ida Maria; Reisberg, Sulev, juhendaja; Jääger, Kersti, juhendaja; Tartu Ülikool. Loodus- ja täppisteaduste valdkond; Tartu Ülikool. Arvutiteaduse instituutPharmacogenetics is a branch of personalised medicine that investigates the impact of genetic fac-tors on drug response. Adequate IT solutions are the key components of applying pharmacogenetic knowledge to clinical practice. This thesis describes the process of designing and implementing a curated scientific knowledge base to be used by a software-based medical device for pharmaco-genetic testing. Based on scientific literature, a prototype is built to identify main domain objects and processes for curating the knowledge base. The final implementation is created by using the Qure Data Management Platform.Item Workflow for Transforming Health Records to OMOP Common Data Model(Tartu Ülikool, 2022) Talvik, Harry-Anton; Laur, Sven, juhendaja; Kolde, Raivo, juhendaja; Reisberg, Sulev, juhendaja; Tartu Ülikool. Loodus- ja täppisteaduste valdkond; Tartu Ülikool. Arvutiteaduse instituutIn recent years, there has been a growing need in health informatics to use operational health data for research. In Estonia, medical data generated as part of daily work in healthcare institutions are exchanged in HL7 CDA format. The challenge is correctly converting the data from its exchange format for analytical use; this is a very timeconsuming process. This work aims to describe the overall workflow for converting data to a common data model (OMOP CDM) for analytical purposes. As a practical solution, an improved capability for data exploration and initial information extraction from the CDA format has been created. Improved automation of the workflow environment enables rapid deployment of the solution. The resulting data in OMOP CDM is suitable for generating evidence that promotes better health decisions and better care.