Hindamine osakogumites abiinformatsiooni olemasolul

Date

2013-06-10

Authors

Binsol, Paavo

Journal Title

Journal ISSN

Volume Title

Publisher

Tartu Ülikool

Abstract

Üldkogumi gruppide ehk osakogumite efektiivne hindamine on oluline ülesanne paljudes tänapäeva statistika uuringutes ja firmades. Traditsiooniline lähenemine sääraste hinnangute leidmiseks on otsesed hinnangud (direct estimates). Võib aga juhtuda, et valimimahud osakogumites on väga väikesed, mille tõttu otseste hinnangute varieeruvus muutub väga suureks. Esineb olukordi, kus valimisse ei sattu mõne osakogumi korral ühtegi vaatlust, siis pole otsest hinnangut isegi võimalik leida. Väikeste osakogumite hinnangute teooria (Small area estimation methods theory) tegeleb selliste probleemide uurimisega. (Saei & Chambers, 2003) Lahenduseks kasutatakse mudelipõhiseid ehk mitteotseseid hinnanguid. Sageli on üldkogumi kohta teada abiinformatsioon (auxiliary information), mida on võimalik kasutada väikeste osakogumite hinnangute täpsuse parandamiseks. Selliste meetodite kasutamist on statistilises kirjanduses tõlgendatud, kui “jõu laenamisena“ uuritava tunnuse ja abitunnuste vahelisest seosest (Saei & Chambers, 2003, lk 2). Siin töös on mudelipõhiste hinnangutena kasutatud GREG-i (Generalized regression estimator) ja segamudelit (Mixed models). Käesoleva töö uuritavaks parameetriks on kindla tunnuse kogusumma osakogumis ning eesmärgiks ongi kirjeldada ja uurida, millised meetodid annavad kõige täpsema hinnangu. Samuti on eeldatud, et valimi võtmisel on kasutatud kahte valikudisaini, lihtsat juhuslikku valikut tagasipanekuta ja tagasipanekuga. Huvipakkuv on see, kas erinevate valikudisainide puhul võivad tulemused märgatavalt erineda? Mudelipõhiste hinnangute tõhususe uurimiseks on võrdlusena leitud Horwitz-Thompsoni ja Hansen-Hurwitzi hinnanguid, mille omavaheline erinevus seisneb ainult valimi võtmise meetodis. Kahe viimase nimetatud hinnangu puhul ei kasutata abi informatsiooni. Töö on üle ehitatud järgmiselt. Esimeses peatükis esitatakse vajalikud esialgsed terminid ja teoreemid, millele hiljem toetuda. Teine kuni neljas peatükk iseloomustavad töös kasutatavaid hinnanguid (Horvitz-Thompson, Hansen-Hurwitz, GREG, segamudelil põhinev hinnang). Samuti on kirjeldatud, kuidas neid hinnanguid saab rakendada osakogumite hindamisel. Viiendas peatükis on võrreldud nelja hinnangut simulatsioonülesandes, kus kasutatud andmestik on moodustatud ühe Kanada hüpoteetilise küla andmete põhjal. Hinnangute headuse võrdlemiseks on defineeritud täpsusnäitajad, mis arvutatakse simulatsioonis kasutatud andmestiku põhjal. Simulatsiooni läbiviimiseks ja tulemuste illustreerimiseks kasutati statistikapaketti R ning Microsoft Excelit. Lisas on esitatud hinnangute ning täpsusnäitajate leidmise ja andmestiku moodustamise R-i kood. Samuti on esitatud tööga kaasasoleval CD-l algne andmestik ning programm.

Description

Keywords

Citation