arvutiteaduse instituudi lõputööderegister


Finantsteemaliste artiklite lihtsustamine
Nimi Kristin Petersel
Kokkuvõte Paljud finantsteemalised artiklid sisaldavad valdkonnaspetsiifilist sõnavara, mistõttu võivad need tavalugejale olla keerulised mõista. Magistritöö raames uuritakse tihedalt tarbitavate allikate artiklite põhjal, kui palju keerulist sõnavara neis sisaldub ning kui edukalt on keeletehnoloogia vahendite abil võimalik teksti lugejale lihtsamaks teha. Artiklites märgendati väliste lugejate poolt nende silmis keerulised sõnad, mida lihtsustatakse kahe meetodiga: teksti tõlkimine Tartu Ülikooli Neurotõlke abil ning keeruliste sõnade sünonüümimine, kasutades EstNLTK Wordneti sünohulkasid ning eeltreenitud skip-gram mudelit. Analüüs näitas, et vaadeldavates artiklites moodustasid keerulised sõnad ligi 2% kõikidest sõnadest. Nende lihtsustamisel olid tõlkemeetodi tulemused üldiselt edukamad, kuna sünonüümimise puhul ei olnud keerulise sõna sünonüüm alati lihtsamini mõistetav või siis ei leidunud Wordnetis vaadeldavale sõnale ühtegi sünonüümi.
Lõputöö keel eesti
Lõputöö tüüp Magister - Andmeteadus
Juhendaja(d) Mark Fišel, Lehar Oha
Kaitsmise aasta 2022
PDF