arvutiteaduse instituudi lõputööderegister


Depressioonisümptomite tuvastamine Redditi postitustest
Nimi Kaire Koljal
Kokkuvõte Sotsiaalmeedia postituste kasutamine vaimse tervisega seotud probleemide tuvastamiseks on muutunud populaarseks teemaks loomuliku keele töötluse valdkonnas. Masinõpet on kasutatud ka diagnoosi või üksikute depressiooni sümptomite tuvastamisel. Kuna depressiooniga inimestel võib olla erinev kliiniline pilt, siis on mõistlikum diagnoosi asemel sotsiaalmeedia postitustest tuvastada sümptomeid. Selles töös ennustatakse depressiooni sümptomeid Redditi r/depression lehelt kogutud postituste baasil kasutades NLP meetodeid ja mitme märgendi klassifikatsiooni. Töö raames uuritakse märgenduste kvaliteeti ja hinnatakse, kas sellise kvaliteediga andmestikku saab kasutada ennustava mudeli treenimiseks. Igat postitust märgendas kolm inimest ning märgendusi ühestatakse kolmel moel, et luua andmestikud, mida kasutatakse Transformeri mudelite treenimiseks. Tulemused näitavad, et madalama märgenduste üksmeelega andmete puhul annab enamushäälega märgenduste ühestamine kõige usaldusväärsemad tulemused ja andmestiku. RoBERTa mudel näitab kõige paremat õppimis ja üldistamisvõimet.
Lõputöö keel inglise
Lõputöö tüüp Magister - Informaatika
Juhendaja(d) Kairit Sirts
Kaitsmise aasta 2022
PDF