Metafooride tuvastamine eesti keele jaoks

Nimi
Claudia Kittask
Kokkuvõte
Metafoorid on kirja- ja kõnekeeles väga tavalised. Inimeste jaoks on metafooride tekstist tuvastamine ja neile tähenduse andmine lihtne. Masinate jaoks see nii kerge ei ole. Sellega seoses on metafooride valdkonnas viimastel aastakümnendal palju teadustööd tehtud kasutades nii reeglipõhiseid kui ka sügavate närvivõrkude põhiseid süsteeme. Enamus nendest teadustöödest keskendub siiski ainult inglise keelele. Selle magistritöö tegemise ajal ei olnud Eesti keele jaoks veel arvutuslikke käsitlusi metafooride kohta tehtud. Käesolevas magistritöös keskendutakse olemasolevate metafooride tuvastamise meetodite rakendamisega just Eesti keele jaoks. Kõik rakendatud meetodid on juhendamata või nõrgalt juhendatud, sest Eesti keele jaoks ei ole metafooride andmestike veel loodud. Käesolev magistritöö katsetab ka BERT mudeli kontektuaalsete vektoresituste lisamisega metafooride tuvastamise süsteemi, et tulemusi parandada. Meetodite testimiseks loodi Eesti keele jaoks uus andmestik. Koostatud andmestik koosneb 500 lausest, millest 232 lauset omab TEGUSÕNA-NIMISÕNA fraasi, kus TEGUSÕNA on kasutatud metafooriliselt ja 268 lauset, kus fraasi on kasutatud literaalselt. Parim tulemus saavutati kasutades BERTi kontektuaalseid vektoresitusi koos WordNet’iga.
Lõputöö keel
inglise
Lõputöö tüüp
Magister - Informaatika
Juhendaja(d)
Eduard Barbu
Kaitsmise aasta
2021
 
PDF