Ülikoolist väljalangemise ennustamine masinõppe mudelite abil

Laen...
Pisipilt

Kuupäev

Ajakirja pealkiri

Ajakirja ISSN

Köite pealkiri

Kirjastaja

Tartu Ülikool

Abstrakt

Kõrge väljalangevus on aktuaalne probleem kõrgkoolides üle maailma. Kuna teema puudutab negatiivselt nii tudengeid ja kõrgkoole kui ka ühiskonda tervikuna, on väljalangemisriski ennustamine populaarne uurimisvaldkond. Antud bakalaureusetöö eesmärk on luua masinõppe mudel Tartu Ülikooli bakalaureuse-, rakenduskõrghariduse ja integreeritud õppe tudengite väljalangemisriski prognoosimiseks, kasutades selleks Tartu Ülikooli õppeinfosüsteemi poolt aastatel 2011 kuni 2022 kogutud õpianalüütilisi andmeid. Uurimistöö raames rakendati ja hinnati mitmeid erinevate algoritmiliste lähenemisviisidega masinõppe mudeleid, võimaldamaks nende ulatuslikku võrdlevat analüüsi. Täpsemini saavutati parimad ennustustulemused otsustusmetsa algoritmil põhineva ennustusmudeliga, mis suutis testandmestikul tuvastada 88% väljalangejatest. Mudeli ROC AUC skoor oli 0,94, mis viitab väga kõrgele klasside eristamise võimekusele. Kuigi need tulemused on paljulubavad, on üldistatavuse tagamiseks siiski oluline uuemate andmete lisandumisel kontrollida mudeli toimivust. Praktilise töö tulemusena loodi riskimudelite kogum, millel on võrreldes praegu Tartu Ülikoolis kasutatava mudeliga parem ennustamisvõime. Tulevikus on võimalik loodud mudelid integreerida ülikooli õpianalüütika töölauaga, mis võimaldaks programmijuhtidel riskiolukordades ennetavalt sekkuda.

Kirjeldus

Märksõnad

masinõpe, otsustusmets, XGBoost, logistiline regressioon, Python, klassifitseerimisalgoritm, tasakaalustamata andmed, ülikool, väljalangeja

Viide