Finantsteemaliste artiklite lihtsustamine

Nimi
Kristin Petersel
Kokkuvõte
Paljud finantsteemalised artiklid sisaldavad valdkonnaspetsiifilist sõnavara, mistõttu võivad need tavalugejale olla keerulised mõista. Magistritöö raames uuritakse tihedalt tarbitavate allikate artiklite põhjal, kui palju keerulist sõnavara neis sisaldub ning kui edukalt on keeletehnoloogia vahendite abil võimalik teksti lugejale lihtsamaks teha. Artiklites märgendati väliste lugejate poolt nende silmis keerulised sõnad, mida lihtsustatakse kahe meetodiga: teksti tõlkimine Tartu Ülikooli Neurotõlke abil ning keeruliste sõnade sünonüümimine, kasutades EstNLTK Wordneti sünohulkasid ning eeltreenitud skip-gram mudelit. Analüüs näitas, et vaadeldavates artiklites moodustasid keerulised sõnad ligi 2% kõikidest sõnadest. Nende lihtsustamisel olid tõlkemeetodi tulemused üldiselt edukamad, kuna sünonüümimise puhul ei olnud keerulise sõna sünonüüm alati lihtsamini mõistetav või siis ei leidunud Wordnetis vaadeldavale sõnale ühtegi sünonüümi.
Lõputöö keel
eesti
Lõputöö tüüp
Magister - Andmeteadus
Juhendaja(d)
Mark Fišel, Lehar Oha
Kaitsmise aasta
2022
 
PDF