Spordiennustused: kihlveokontoritega konkureerimine NBA-s

Date

2014-06-17

Journal Title

Journal ISSN

Volume Title

Publisher

Tartu Ülikool

Abstract

Käesolev magistritöö püüab näidata, et spordikihlvedusid võib sõlmida professionaalsetel alustel, arvestades riskiga ja baseerides panustamisotsused matemaatikale. Töös on sporditulemustele ennustamist vaadeldud mitmekülgselt, alustades teema motiveerimisega ja probleemistiku uurimisega, kogudes ja korrastades suurel hulgal olulisi andmed, tutvustades juba varasemalt tehtud töid ja ideid; pakutud on uusi lahendusi, implementeeritud mitmeid algoritme ja teostatud kogutud andmetel põhjalik analüüs. Magistritöö jaoks on veebiroboti abil kogutud enam kui 15000 korvpallimängu andmed aastatelt 2000 kuni 2013 ja rohkem kui 5000 korvpallimängu koefitsiendid paljudelt kihlveokontoritelt. Mängude kohta kogutud informatsioon hõlmab nii meeskondade, mängijate ja viisikute kohta käivaid kokkuvõtlikke statistikuid kui ka sündmus-sündmus andmeid. Kõik andmed on korrastatud ja organiseeritud relatsioonilisse andmebaasi. Analüüsi osas veenduti esialgu teoreetiliselt tõestatud tulemuses, et juhuslikult spordisündmustele panustamine on keskmiselt kahjumlik. Seejärel püüti kasumlikult panustada lihtsate mudelite abil, mis klassifitseerisid korvpallimängu võitja meeskondade eelnevate omavaheliste mängude põhjal. Leiti mudel, mis suurest testandmetel tehtud klassifitseerimisveast (41,4%) hoolimata andis panustamissituatsioonis suure tulususe. Kihlveokontoreid püüti võita ka tehisõppe meetodite abil. Selleks kasutati logistilist regressiooni ja AdaBoosti, sobivate tunnuste valikuks implementeeriti mitmed heuristikud. Ükski nimetatud meetoditega treenitud klassifitseerija ei olnud panustamisel kasumlik, samas suutis parim logistilise regressiooni mudel klassifitseerida korrektselt 68,9% testmängudest. Lihtsate mudelite ja tehisõppe meetoditega leitud mudelite põhjal veendusime, et parem klassifitseerija ei pruugi anda suuremat kasumit. Seetõttu on klassifitseerijate ehitamisel treeningriski minimiseerimise asemel proovitud maksimiseerida ka treeningkasumit. Ideed on püütud jõuga realiseerida otsustuspuude abil. Samuti on implementeeritud modifitseeritud AdaBoosti meetod, mis kaalus vaatlusi vastavalt koefitsientide suurusele ja töötas kohati paremini kui originaalne AdaBoost. Lisaks on korvpallimängude võitjaid proovitud ennustada korvpallitulemuste simuleerimise abil Poissoni protsesside põhjal.

Description

Keywords

algoritmid, andmekaeve, andmevalmendus, juhuslikud protsessid, klassifitseerimine, korvpall, matemaatilised mudelid, mustriotsing, optimiseerimine, simulatsioon, spordiennustused, statistiline andmetöötlus, tehisõpe

Citation