Multivocal Literature Review on Data Quality Challenges in Data Pipelines

Laen...
Pisipilt

Kuupäev

Ajakirja pealkiri

Ajakirja ISSN

Köite pealkiri

Kirjastaja

Tartu Ülikool

Abstrakt

See magistritöö annab süstemaatilise ülevaate andmekvaliteedi probleemidest ja väljakutsetest andmetorudes. Andmetorude protsessid töötlevad andmeid mitmel erineval moel ja magistritöö üritab leida enim mainitud probleemid, mis andmekvaliteeti andmetorudes mõjutavad. Töös on kasutatud multivokaalset lähenemist, mis käsitleb teaduslikele uuringutele lisaks ka halli kirjandust, et anda andmetorude vähesest käsitlusest tulenemata täpseid tulemusi. Töö annab lisaks ülevaate nii lahendustest kui ka avatud küsimustest, et andmetorude ehitamise valdkonda edasi arendada. Töös teostatud andmekvaliteedi probleemide kaardistus koos lahendustega on juhend, et andmekvaliteedi väljakutseid andmetorudes paremini mõista ja leida kohti edaspidisteks uuringuteks.

Kirjeldus

Märksõnad

Data pipelines, data quality, challenges, multivocal literature review, Andmetorud, andmekvaliteet, väljakutsed, probleemid, multivokaalne kirjanduse ülevaade

Viide