arvutiteaduse instituudi lõputööderegister


Metafooride tuvastamine eesti keele jaoks
Nimi Claudia Kittask
Kokkuvõte Metafoorid on kirja- ja kõnekeeles väga tavalised. Inimeste jaoks on metafooride tekstist tuvastamine ja neile tähenduse andmine lihtne. Masinate jaoks see nii kerge ei ole. Sellega seoses on metafooride valdkonnas viimastel aastakümnendal palju teadustööd tehtud kasutades nii reeglipõhiseid kui ka sügavate närvivõrkude põhiseid süsteeme. Enamus nendest teadustöödest keskendub siiski ainult inglise keelele. Selle magistritöö tegemise ajal ei olnud Eesti keele jaoks veel arvutuslikke käsitlusi metafooride kohta tehtud. Käesolevas magistritöös keskendutakse olemasolevate metafooride tuvastamise meetodite rakendamisega just Eesti keele jaoks. Kõik rakendatud meetodid on juhendamata või nõrgalt juhendatud, sest Eesti keele jaoks ei ole metafooride andmestike veel loodud. Käesolev magistritöö katsetab ka BERT mudeli kontektuaalsete vektoresituste lisamisega metafooride tuvastamise süsteemi, et tulemusi parandada. Meetodite testimiseks loodi Eesti keele jaoks uus andmestik. Koostatud andmestik koosneb 500 lausest, millest 232 lauset omab TEGUSÕNA-NIMISÕNA fraasi, kus TEGUSÕNA on kasutatud metafooriliselt ja 268 lauset, kus fraasi on kasutatud literaalselt. Parim tulemus saavutati kasutades BERTi kontektuaalseid vektoresitusi koos WordNet’iga.
Lõputöö keel inglise
Lõputöö tüüp Magister - Informaatika
Juhendaja(d) Eduard Barbu
Kaitsmise aasta 2021
PDF