arvutiteaduse instituudi lõputööderegister


Negatiivsete mõttemustrite tuvastamine Redditi postitustest juhendatud masinõppe meetoditega
Nimi Linda Katariina Grents
Kokkuvõte Vaimse tervise olulisus on ühiskonnas üha enam kõlapinda kinnitamas. Inimesed on muutunud avatumaks ning julgevad oma mõtteid suurema publikuga jagada. Seda on oluliselt lihtsustanud inimeste seotus veebis. Tihtipeale kasutatakse mõtete jagamiseks eri sotsiaalmeedia platvorme, sh Redditit. Selle töö eesmärk on tuvastada Redditi ärevuseteemalise foorumi postitutest kognitiivseid kaldeid ehk negatiivseid mõttemustreid, mis võivad omada negatiivset mõju vaimsele tervisele. Lisaks uuritakse annoteerijate vahelist kooskõla, kasutades Coheni Kappa ning Krippendorffi alfa väärtuseid. Kaldeid tuvastatakse tekstist kasutades juhendatud masinõppe meetodeid nagu logistiline regressioon, tugivektor-masin ning fasttext (samuti eeltreenitud sõnavektoritega). Töö tulemused näitavad sarnaselt varasematele teadustöödele, et kallete tüüpide tuvastamine tekstist on algoritmidele keeruline ülesanne. Tööst selgub, et kalde olemasolu tekstist on algoritmidel lihtsam tuvastada kui kallete tüüpe. Kalde olemasolu tuvastamine võib seejuures olla isegi kasulikum ja efektiivsem kui eri tüüpide tuvastamine, aitamaks depressiivsete kalduvustega või ärevushäirete all kannatavaid inimesi. Samuti võib olla kasulik enam-levinud kallete tuvastamine, sest mõned kalded esinevad tõenäoliselt tihedamini kui teised. Oluline on mainida, et töös kasutatud andmestik on aga üsna väike ja ebatäpne ning eri tüüpide tuvastamiseks on tõenäoliselt vaja suuremamahulist ja parema kvaliteediga andmestikku. See on aga loomuliku keele töötluse ja kliinilise psühholoogia teadusalal omaette väljakutse.
Lõputöö keel inglise
Lõputöö tüüp Magister - Andmeteadus
Juhendaja(d) Kairit Sirts
Kaitsmise aasta 2022
PDF