Depressioonisümptomite tuvastamine Redditi postitustest

Nimi
Kaire Koljal
Kokkuvõte
Sotsiaalmeedia postituste kasutamine vaimse tervisega seotud probleemide tuvastamiseks on muutunud populaarseks teemaks loomuliku keele töötluse valdkonnas. Masinõpet on kasutatud ka diagnoosi või üksikute depressiooni sümptomite tuvastamisel. Kuna depressiooniga inimestel võib olla erinev kliiniline pilt, siis on mõistlikum diagnoosi asemel sotsiaalmeedia postitustest tuvastada sümptomeid. Selles töös ennustatakse depressiooni sümptomeid Redditi r/depression lehelt kogutud postituste baasil kasutades NLP meetodeid ja mitme märgendi klassifikatsiooni. Töö raames uuritakse märgenduste kvaliteeti ja hinnatakse, kas sellise kvaliteediga andmestikku saab kasutada ennustava mudeli treenimiseks. Igat postitust märgendas kolm inimest ning märgendusi ühestatakse kolmel moel, et luua andmestikud, mida kasutatakse Transformeri mudelite treenimiseks. Tulemused näitavad, et madalama märgenduste üksmeelega andmete puhul annab enamushäälega märgenduste ühestamine kõige usaldusväärsemad tulemused ja andmestiku. RoBERTa mudel näitab kõige paremat õppimis ja üldistamisvõimet.
Lõputöö keel
inglise
Lõputöö tüüp
Magister - Informaatika
Juhendaja(d)
Kairit Sirts
Kaitsmise aasta
2022
 
PDF