Lepik, Natalja, juhendajaEigo, Natalja, juhendajaKirpu, ViktoriaTartu Ülikool. Matemaatika ja statistika instituutTartu Ülikool. Loodus- ja täppisteaduste valdkond2018-06-272018-06-272018http://hdl.handle.net/10062/61033Töö eesmärk on Haigekassale saadetavate andmete täiendamine kasutades lisainformatsiooni allikana tervise infosüsteemi andmeid. Selleks on mõlema andmebaasi andmed omavahel ühendatud ning vastavalt sellele leitud paljudele Haigekassa andmebaasis ravikindlustuseta patsientide vanused. Vaadeldavat tunnust toovad välja tervise infosüsteemi epikriisid, kuid Haigekassa raviarvetel see info puudub. Nendele epikriisidele, kus patsientidele vanust ei õnnestunud leida, imputeeritakse puuduolevad andmed kolmel meetodil: üldine Hot-Deck omistus, lähima naabri meetod ja Hot-Deck omistus klassis kombineerituna lähima naabri meetodiga. Ühendamise protsessis suudeti leida vanused 5633 ravikindlustuseta patsiendi raviarvele ja vanuseta jäid 3515 raviarvet. Edasise analüüsi tulemuste põhjal otsustati kasutada üldise juhusliku Hot-Deck meetodiga saadud väärtusi, sest imputeerimiste simuleerimise katsel andis vaadeldav meetod kõige täpsemaid ja stabiilsemaid tulemusi.estopenAccessAttribution-NonCommercial-NoDerivs 3.0 Estoniaandmeanalüüsstatistiline andmetöötluspuuduvad andmedvaatlusveadimputeerimineHot-Deck meetodlähima naabri meetoddata processingstatistical data processingmissing dataobservation errorsimputationHot-Deck methodnearest neighbour methodandmeanalüüsstatistiline andmetöötluspuuduvad andmedvaatlusveadHaigekassa kindlustamata patsientide vigastuste andmete imputeerimineinfo:eu-repo/semantics/bachelorThesis