arvutiteaduse instituudi lõputööderegister


Automaatne kognitiivsete kallete tuvastamine ja klassifitseerimine Redditi postitustest kasutades masinõpet
Nimi Stanislav Sochynskyi
Kokkuvõte Liialdatud mõttemustrite nõiaring, mida nimetatakse ka kognitiivseteks kalleteks, võib inimese viia ärevuse ja depressioonini. Kognitiivsete kallete automaatne avastamine ja liigitamine võib olla kasulik esmaseks vaimse tervise sõeluuringuks, nõustamisaja paremaks kasutamiseks ning vaimse tervise teenuste kättesaadavuse parandamiseks. Selles töös kasutame logistilise regressiooni, tugivektormasina (SVM) ning fasttexti klassifikaatoreid, et tuvastada kognitiivseid kaldeid Redditist pärit reaalmaailma andmetest. Binaarsel klassifitseerimisel saadi parim F-skoor 0,71 fasttext klassifikaatoriga. Erinevate kognitiivsete kallete eristamise klassifikatsiooniülesande puhul saavutati parim F-skoor 0,23 tugivektormasinaga, kasutades tf-idf vektorisatsiooni. Siiski ei ületa siin mõne klassi mõõdikud juhusliku klassifitseerija piiri. Võimalik seletus on see, et loodud andmestik on binaarse klassifikaatori treenimiseks piisav, kuid täpsemad mudelid nõuavad suurema arvu klasside eristamiseks rohkem andmeid. Lisaks eksperimenteerisime juhendamata klasterdamise ja teemamudelite algoritmidega ning ei leidnud tõendeid selle kohta, et juhendamata meetodid suudaksid tekstist tuvastada kognitiivsete kallete mustreid. Töötasime välja annoteerimisjuhised kognitiivsete kallete käsitsi märgendamiseks ning rakendasime seda 2021 Redditi postituse annoteerimiseks. Annoteerijate vahelise kooskõla kappa skoor oli 0,569 binaarsel juhul ja 0,424 erinevate kaldetüüpide annotatsioonide puhul, mis tähendab mõõdukat kooskõla annoteerijate vahel. Suurem arv klasse toob kaasa kehvema kooskõla annotatsioonides, mis on tingitud peamiselt sellest, et mõnede kognitiivsete kallete määratlusted kattuvad. Seega ei saa automatiseeritud meetoditelt eeldada kõrgeid tulemusi erinevate kognitiivsete kallete eristamisel.
Lõputöö keel inglise
Lõputöö tüüp Magister - Innovatsiooni ja tehnoloogia juhtimine
Juhendaja(d) Kairit Sirts
Kaitsmise aasta 2021
PDF