Tõenäosuslike klassifikaatorite liigne enesekindlus ja temperatuuri-skaleerimine

Date

2022

Journal Title

Journal ISSN

Volume Title

Publisher

Tartu Ülikool

Abstract

Magistritöös keskendume diskriminatiivsetele klassifikaatoritele nagu diskriminantanalüüs, logistiline regressioon ja tehisnärvivõrgud, millest viimased on oma võimekuse tõttu saavutanud möödunud kümnenditel suure populaarsuse. Populaarsusest ja võimekusest hoolimata on selgeks saanud, et suured tehisnärvivõrgud ei ole hästi kalibreeritud ning kipuvad olema liiga enesekindlad (Guo et al. 2017). Mudeli liigne enesekindlus tähendab seda, et olukorras, kus mudel tegelikult ei tea kindlalt, mis on õige väljund, annab ta ikkagi oma otsusele kõrge tõenäosuse. Töö fookuses ongi tõenäosuslike klassifikaatorite liigne enesekindlus ja selle ravimine temperatuuri-skaleerimise meetodi abil. Viimane on praktikas osutunud väga kasulikuks, kuid pole päris selge, miks see meetod ikkagi nii hea on. Magistritöös annamegi esmalt ülevaate temperatuuri-skaleerimise kalibratsioonimeetodist ning mudeli liigsest enese- ja ebakindlusest. Seejärel näitame, et liigne enesekindlus ei ole vaid suurte tehisnärvivõrkude mure vaid esineb teatud juhtudel ka lihtsate mudelite korral nagu diskriminantanalüüs ja logistiline regressioon. Muuhulgas näitame, et mudeli liigne enesekindlus kajastub ka tema treening- ja valideerimisskoorijaotuste erinevuses. Lõpuks tõestame, et vähemalt millistel eeldustel kalibreerib temperatuuri-skaleerimine mudeli ning seletame, miks ta praktikas niivõrd hästi töötab.

Description

Keywords

Tehisõpe, tehisnärvivõrgud, andmeteadus, liigne enesekindlus, temperatuuriskaleerimine, kalibreerimine

Citation