Ülikoolist väljalangemise ennustamine masinõppe mudelite abil
Nimi
Kertu-Carina Kallaste
Kokkuvõte
Kõrge väljalangevus on aktuaalne probleem kõrgkoolides üle maailma. Kuna teema puudutab negatiivselt nii tudengeid ja kõrgkoole kui ka ühiskonda tervikuna, on väljalangemisriski ennustamine populaarne uurimisvaldkond. Antud bakalaureusetöö eesmärk on luua masinõppe mudel Tartu Ülikooli bakalaureuse-, rakenduskõrghariduse ja integreeritud õppe tudengite väljalangemisriski prognoosimiseks, kasutades selleks Tartu Ülikooli õppeinfosüsteemi poolt aastatel 2011 kuni 2022 kogutud õpianalüütilisi andmeid.
Uurimistöö raames rakendati ja hinnati mitmeid erinevate algoritmiliste lähenemisviisidega masinõppe mudeleid, võimaldamaks nende ulatuslikku võrdlevat analüüsi. Täpsemini saavutati parimad ennustustulemused otsustusmetsa algoritmil põhineva ennustusmudeliga, mis suutis testandmestikul tuvastada 88% väljalangejatest. Mudeli ROC AUC skoor oli 0,94, mis viitab väga kõrgele klasside eristamise võimekusele. Kuigi need tulemused on paljulubavad, on üldistatavuse tagamiseks siiski oluline uuemate andmete lisandumisel kontrollida mudeli toimivust.
Praktilise töö tulemusena loodi riskimudelite kogum, millel on võrreldes praegu Tartu Ülikoolis kasutatava mudeliga parem ennustamisvõime. Tulevikus on võimalik loodud mudelid integreerida ülikooli õpianalüütika töölauaga, mis võimaldaks programmijuhtidel riskiolukordades ennetavalt sekkuda.
Uurimistöö raames rakendati ja hinnati mitmeid erinevate algoritmiliste lähenemisviisidega masinõppe mudeleid, võimaldamaks nende ulatuslikku võrdlevat analüüsi. Täpsemini saavutati parimad ennustustulemused otsustusmetsa algoritmil põhineva ennustusmudeliga, mis suutis testandmestikul tuvastada 88% väljalangejatest. Mudeli ROC AUC skoor oli 0,94, mis viitab väga kõrgele klasside eristamise võimekusele. Kuigi need tulemused on paljulubavad, on üldistatavuse tagamiseks siiski oluline uuemate andmete lisandumisel kontrollida mudeli toimivust.
Praktilise töö tulemusena loodi riskimudelite kogum, millel on võrreldes praegu Tartu Ülikoolis kasutatava mudeliga parem ennustamisvõime. Tulevikus on võimalik loodud mudelid integreerida ülikooli õpianalüütika töölauaga, mis võimaldaks programmijuhtidel riskiolukordades ennetavalt sekkuda.
Lõputöö keel
eesti
Lõputöö tüüp
Bakalaureus - Informaatika
Juhendaja(d)
Elena Sügis, Leo Siiman
Kaitsmise aasta
2023