arvutiteaduse instituudi lõputööderegister


Parima närvivõrkudel põhineva masintõlkemudeli treenimine eesti-inglise keelepaarile
Nimi Kristiina Kuningas
Kokkuvõte Tänaseks päevaks on maailmas treenitud suurel hulgal närvivõrkudel põhinevaid masintõlkemudeleid, et pakkuda paljudele keeltele kõrge kvaliteediga tõlkeid. Seda sama on tehtud ka eesti-inglise keelepaarile. Küll aga on selle keelepaari jaoks treenitud mudelid enamasti mitmekeelsed või vananenud ning vajavad täiustamist. See bakalaureusetöö esitleb kahekeelset lähenemist kasutades uusi efektiivseid tehnoloogiaid ja kõige värskemaid saadaolevaid andmestikke selleks, et parendada seni parimat tulemust eesti-inglise keelepaaril. Selles töös treenitakse eesti keelest inglise keelde parimat tõlkekvaliteeti pakkuv masintõlkemudel, mis ületab ka varasema parima tulemuse. Soovitud eesmärgi saavutamiseks kasutatakse erinevaid meetodeid - treenitakse paralleelsetel andmetel põhinev baasmudel, sünteesitakse saadaolevate monokeelsete andmete ja tagasitõlke abil uus andmestik, kombineeritakse esialgne paralleelandmestik uue sünteetilise andmestikuga, treenitakse mudel suurenenud paralleelkorpusel ning lõpuks komplekteeritakse need juba treenitud mudelid kokku.
Lõputöö keel inglise
Lõputöö tüüp Bakalaureus - Informaatika
Juhendaja(d) Andre Tättar
Kaitsmise aasta 2021
PDF