Eesti alaliste elanike määramine kasutades masinõppe meetodeid

dc.contributor.advisorTrasberg, Terje, juhendaja
dc.contributor.advisorKolde, Raivo, juhendaja
dc.contributor.authorSaks, Egle
dc.contributor.otherTartu Ülikool. Loodus- ja täppisteaduste valdkondet
dc.contributor.otherTartu Ülikool. Arvutiteaduse instituutet
dc.date.accessioned2023-10-24T10:51:24Z
dc.date.available2023-10-24T10:51:24Z
dc.date.issued2023
dc.description.abstractRiiklikul statistikal on oluline roll levitada ühiskonna kohta teadmisi ja fakte, mis võimaldaksid teha informeeritud otsuseid. Üks olulisemaid riikliku statistika levitavaid teadmisi on info rahvastiku kohta ning selle keskmes on info rahvaarvu kohta. Järjest kiiremini muutuvas maailmas vananeb informatsioon kiiremini kui varem ning seega oodatakse ka rahvastikustatistikat kiiremini ja tihemini. Euroopa Komisjon valmistab juba ette määrust, millega tuleks alaliste elanike arvu riigis avaldada kaks korda aastas. Praegu pannakse Eestis alalise elanikkonna kogum kokku kasutades 18 erinevat registrit, mis muudab tihemini avaldamise keeruliseks. Selle magistritöö eesmärk on uurida, millised andmed on residentsuse määramiseks kõige olulisemad ja kuidas saavad elanikkonna määramisega vähendatud andmete kontekstis hakkama masinõppe mudelid. Töö eesmärgi täitmiseks on kasutatud Eesti Statistikaameti poolt kättesaadavaks tehtud andmeid. Andmetel rakendatakse peakomponentide analüüsi ning testitakse viit erinevat masinõppe mudelit. Tulemused näitavad, et vähendatud andmestik toimib üsna võrdväärselt algse andmestikuga ning residentsuse tuvastamiseks võib piisata ka väiksemast hulgast registritest. Masinõppe meetoditest toimivad kõige paremini otsustusmets ja XGBoost.et
dc.identifier.urihttps://hdl.handle.net/10062/93702
dc.language.isoestet
dc.publisherTartu Ülikoolet
dc.rightsopenAccesset
dc.rightsAttribution-NonCommercial-NoDerivatives 4.0 International*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/*
dc.subjectRegistridet
dc.subjectalaline elaniket
dc.subjectmasinõpeet
dc.subjectrahvastiket
dc.subjectstatistikaet
dc.subject.othermagistritöödet
dc.subject.otherinformaatikaet
dc.subject.otherinfotehnoloogiaet
dc.subject.otherinformaticset
dc.subject.otherinfotechnologyet
dc.titleEesti alaliste elanike määramine kasutades masinõppe meetodeidet
dc.typeThesiset

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
Saks_MSc_andmeteadus_2023.pdf
Size:
1.81 MB
Format:
Adobe Portable Document Format
Description:

License bundle

Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed upon to submission
Description: