Tõenäosuslike klassifikaatorite liigne enesekindlus ja temperatuuri-skaleerimine

dc.contributor.advisorKull, Meelis, juhendaja
dc.contributor.authorJärve, Joonas
dc.contributor.otherTartu Ülikool. Loodus- ja täppisteaduste valdkondet
dc.contributor.otherTartu Ülikool. Arvutiteaduse instituutet
dc.date.accessioned2023-08-24T07:18:43Z
dc.date.available2023-08-24T07:18:43Z
dc.date.issued2022
dc.description.abstractMagistritöös keskendume diskriminatiivsetele klassifikaatoritele nagu diskriminantanalüüs, logistiline regressioon ja tehisnärvivõrgud, millest viimased on oma võimekuse tõttu saavutanud möödunud kümnenditel suure populaarsuse. Populaarsusest ja võimekusest hoolimata on selgeks saanud, et suured tehisnärvivõrgud ei ole hästi kalibreeritud ning kipuvad olema liiga enesekindlad (Guo et al. 2017). Mudeli liigne enesekindlus tähendab seda, et olukorras, kus mudel tegelikult ei tea kindlalt, mis on õige väljund, annab ta ikkagi oma otsusele kõrge tõenäosuse. Töö fookuses ongi tõenäosuslike klassifikaatorite liigne enesekindlus ja selle ravimine temperatuuri-skaleerimise meetodi abil. Viimane on praktikas osutunud väga kasulikuks, kuid pole päris selge, miks see meetod ikkagi nii hea on. Magistritöös annamegi esmalt ülevaate temperatuuri-skaleerimise kalibratsioonimeetodist ning mudeli liigsest enese- ja ebakindlusest. Seejärel näitame, et liigne enesekindlus ei ole vaid suurte tehisnärvivõrkude mure vaid esineb teatud juhtudel ka lihtsate mudelite korral nagu diskriminantanalüüs ja logistiline regressioon. Muuhulgas näitame, et mudeli liigne enesekindlus kajastub ka tema treening- ja valideerimisskoorijaotuste erinevuses. Lõpuks tõestame, et vähemalt millistel eeldustel kalibreerib temperatuuri-skaleerimine mudeli ning seletame, miks ta praktikas niivõrd hästi töötab.et
dc.identifier.urihttps://hdl.handle.net/10062/91719
dc.language.isoestet
dc.publisherTartu Ülikoolet
dc.rightsopenAccesset
dc.rightsAttribution-NonCommercial-NoDerivatives 4.0 International*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/*
dc.subjectTehisõpeet
dc.subjecttehisnärvivõrgudet
dc.subjectandmeteaduset
dc.subjectliigne enesekindluset
dc.subjecttemperatuuriskaleerimineet
dc.subjectkalibreerimineet
dc.subject.othermagistritöödet
dc.subject.otherinformaatikaet
dc.subject.otherinfotehnoloogiaet
dc.subject.otherinformaticset
dc.subject.otherinfotechnologyet
dc.titleTõenäosuslike klassifikaatorite liigne enesekindlus ja temperatuuri-skaleerimineet
dc.typeThesiset

Failid

Originaal pakett

Nüüd näidatakse 1 - 1 1
Laen...
Pisipilt
Nimi:
Jarve_andmeteadus_2022.pdf
Suurus:
10.06 MB
Formaat:
Adobe Portable Document Format
Kirjeldus:

Litsentsi pakett

Nüüd näidatakse 1 - 1 1
Laen...
Pisipilt
Nimi:
license.txt
Suurus:
1.71 KB
Formaat:
Item-specific license agreed upon to submission
Kirjeldus: