Söömishäirete küsimustike väiksemaks tegemine masinõppega ristvalideerimise kaudu
Laen...
Kuupäev
Autorid
Ajakirja pealkiri
Ajakirja ISSN
Köite pealkiri
Kirjastaja
Tartu Ülikool
Abstrakt
Antud uuringu eesmärk oli leida võimalikult lühike, kuid kehamassiindeksit (KMI) täpselt ennustav komplekt, mis tuleb kokku 318 küsimusega 11-st erinevast emotsiooni- ja söömishäirega küsimustikust. 990 Põhja-Ameerika õpilast (539 naist, 451 meest) jagati 80% treeningandmeteks ja 20% testandmeteks. Seejärel jooksutati nii Lasso mudelit, kui ka RFECV meetodit koos järgnevate mudelitega: mitmene regressioon, otsustuspuu ja XGBoost. Samuti häälestati ka hüperparameetrid korduva KFold ristvalideerimisega. XGBoost andis kõige paremaid tulemusi testandmestikuga valideerimisel (naistel R2=0.280, meestel R2=0.273). Stabiilsuslävendiga p > 90% valiti XGBoosti mudeli leitud tunnustest 57 sobivat meeste küsimust ja 37 naiste küsimust. Meeste KMI'd ennustasid peamiselt DEBQ ja AUDIT küsimustikud, naistel oli variatiivsus suurem. Masinõpe on võimeline vähendama tunnuste arvu selliselt, et KMI ennustusvõime säilib tugev.
Kirjeldus
Märksõnad
masinõpe, ristvalideerimine, söömishäired, kontrollimata söömine, KMI, machine learning, cross‑validation, eating disorders, uncontrolled eating, BMI