Terviseandmete tabeli veergude automaatne tüübituvastus
Date
2022
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Tartu Ülikool
Abstract
Käesoleva töö eesmärgiks on luua automatne veergude tüübi tuvastamise komponent projekti Health Sense raames loodavale terviseandmete anonüümimise tarkvarale. Täpsemalt keskendub komponent terviseandmetele, mis sisaldavad sageli kategoorilisi andmeid. Tüübi tuvastamise protsess jagati kolmeks osas. Regulaaravaldiste abil leitakse, milliste andmetüüpide struktuuriga veeru väärtused sobivad. Seejärel kontrollitakse veeru väärtuste vastavust leitud andmetüüpide lubatud väärtuste loendiga. Viimases sammus valitakse sobivatest andmetüüpidest kõige sobilikum. Lisaks analüüsitakse töös Eesti terviseandmeid, et aru saada, kas terviseandmetes esinevad vead võivad olla probleemiks tüübi tuvastamise juures.
Description
Keywords
Terviseandmed, tüübituvastus, projekt Health Sense