Multivocal Literature Review on Data Quality Challenges in Data Pipelines
Laen...
Kuupäev
Autorid
Ajakirja pealkiri
Ajakirja ISSN
Köite pealkiri
Kirjastaja
Tartu Ülikool
Abstrakt
See magistritöö annab süstemaatilise ülevaate andmekvaliteedi probleemidest ja väljakutsetest andmetorudes. Andmetorude protsessid töötlevad andmeid mitmel erineval moel ja magistritöö üritab leida enim mainitud probleemid, mis andmekvaliteeti andmetorudes mõjutavad. Töös on kasutatud multivokaalset lähenemist, mis käsitleb teaduslikele uuringutele lisaks ka halli kirjandust, et anda andmetorude vähesest käsitlusest tulenemata täpseid tulemusi. Töö annab lisaks ülevaate nii lahendustest kui ka avatud küsimustest, et andmetorude ehitamise valdkonda edasi arendada. Töös teostatud andmekvaliteedi probleemide kaardistus koos lahendustega on juhend, et andmekvaliteedi väljakutseid andmetorudes paremini mõista ja leida kohti edaspidisteks uuringuteks.
Kirjeldus
Märksõnad
Data pipelines, data quality, challenges, multivocal literature review, Andmetorud, andmekvaliteet, väljakutsed, probleemid, multivokaalne kirjanduse ülevaade