Morfoloogilise muuttüübi automaatne tuvastamine
Nimi
Sander Saska
Kokkuvõte
Eesti keel on pidevas arenemises – uusi sõnu tekib juurde erinevate võimalustega. Keelekasutajad oskavad uusi sõnu käänata või pöörata sageli intuitiivselt, kuid keeleteaduses on see intuitsioon formaliseeritud muuttüüpide näol. Käesolev töö uurib, kuidas automatiseerida sõna muuttüübi tuvastamist. Selleks on loodud kaks LSTM-põhist mudelit, mis ennustavad sõnadele muuttüüpe. Mudelite algandmed on võetud Vabamorfi põhileksikonist, mis koosneb peaaegu 74 000 algvormist. Algvormidele on sünteesitud kõik võimalikud sõnavormid ja on ümber töödeldud tehisnärvivõrgule sobivaks kujuks. Üks mudel on treenitud ainult sõna kirjapildil, mille täpsuseks saavutati 95.8%, teisel on lisaks antud sõnaliik, täpsuseks 97.8%.
Lõputöö keel
eesti
Lõputöö tüüp
Bakalaureus - Informaatika
Juhendaja(d)
Siim Orasmaa
Kaitsmise aasta
2024