Matemaatika ja statistika instituut
Permanent URI for this communityhttps://hdl.handle.net/10062/14972
Kuni 2015 Matemaatilise statistika intituut
Browse
Browsing Matemaatika ja statistika instituut by Author "Aasmets, Oliver, juhendaja"
Now showing 1 - 2 of 2
- Results Per Page
- Sort Options
Item Log-suhte teisendustel põhinevad ennustusmudelid soolevähi diagnoosimiseks mikrobioomi andmetelt(2021) Muhu, Kristina; Aasmets, Oliver, juhendaja; Tartu Ülikool. Loodus- ja täppisteaduste valdkond; Tartu Ülikool. Matemaatika ja statistika instituutMagistritöö eesmärk on uurida kompositsionaalsete andmete teooriast tuttavate log-suhte transformatsioonide ja masinõppemeetodite mõju soolevähi ennustusmudelite üldistusvõimele. Täpsemalt uuritakse aditiivse, paariviisilise ning tsentreeritud log-suhte teisenduste ning elastse võrgu ja juhumetsa meetodite kombinatsioonidel põhinevate soolevähki prognoosivate mudelite ennustus- ja üldistusvõimet viie populatsiooni soolestiku mikrobioomi andmeid kasutades. Lisaeesmärk on teada saada parimaid tulemusi andev metoodika, mida saaks võtta aluseks Eesti soolevähi sõeluuringu programmi edendamiseks.Item Statistiliselt ekvivalentsete argumenttunnuste kogumite leidmine(Tartu Ülikool, 2024) Sõnajalg, Hanna; Aasmets, Oliver, juhendaja; Fischer, Krista, juhendaja; Tartu Ülikool. Loodus- ja täppisteaduste valdkond; Tartu Ülikool. Matemaatika ja statistika instituutArgumenttunnuste valik on mudeli konstrueerimisel üks olulisemaid ülesandeid. Meetodid nagu samm- ja lassoregressioon tagastavad ühe komplekti tunnustest, millega saavutatakse kõige paremini prognoosiv mudel. Kui andmetes esineb palju tugevalt korreleeritud tunnuseid, võib mitu tunnuste komplekti anda sarnase prognoosimisvõimega mudeleid. Statistiliselt ekvivalentsete argumenttunnuste kogumite leidmise (inglise keeles statistically equivalent signatures ehk SES) algoritm rakendab tunnuste valikuks korduvalt tingliku sõltumatuse teste. Lõpuks tagastatakse omavahel ekvivalentsete tunnuste kogumid. Valides igast kogumist täpselt ühe tunnuse, jõutakse erinevate mudeliteni, mis võiksid anda sarnase täpsusega hinnanguid. Magistritöö eesmärk on testida algoritmi Eesti geenivaramu andmetel, kuhu kuuluvad geenidoonorite vere metaboliidi kontsentratsioonid ning metaboliitide kontsentratsioonide suhete väärtused. Lineaarse regressioonimudeli abil prognoositakse kehamassiindeksit ja logistilise regressioonimudeli abil suremust 5 aasta jooksul.