Terviseandmete tabeli veergude automaatne tüübituvastus

Date

2022

Journal Title

Journal ISSN

Volume Title

Publisher

Tartu Ülikool

Abstract

Käesoleva töö eesmärgiks on luua automatne veergude tüübi tuvastamise komponent projekti Health Sense raames loodavale terviseandmete anonüümimise tarkvarale. Täpsemalt keskendub komponent terviseandmetele, mis sisaldavad sageli kategoorilisi andmeid. Tüübi tuvastamise protsess jagati kolmeks osas. Regulaaravaldiste abil leitakse, milliste andmetüüpide struktuuriga veeru väärtused sobivad. Seejärel kontrollitakse veeru väärtuste vastavust leitud andmetüüpide lubatud väärtuste loendiga. Viimases sammus valitakse sobivatest andmetüüpidest kõige sobilikum. Lisaks analüüsitakse töös Eesti terviseandmeid, et aru saada, kas terviseandmetes esinevad vead võivad olla probleemiks tüübi tuvastamise juures.

Description

Keywords

Terviseandmed, tüübituvastus, projekt Health Sense

Citation