Parima närvivõrkudel põhineva masintõlkemudeli treenimine eesti-inglise keelepaarile

Nimi
Kristiina Kuningas
Kokkuvõte
Tänaseks päevaks on maailmas treenitud suurel hulgal närvivõrkudel põhinevaid masintõlkemudeleid, et pakkuda paljudele keeltele kõrge kvaliteediga tõlkeid. Seda sama on tehtud ka eesti-inglise keelepaarile. Küll aga on selle keelepaari jaoks treenitud mudelid enamasti mitmekeelsed või vananenud ning vajavad täiustamist. See bakalaureusetöö esitleb kahekeelset lähenemist kasutades uusi efektiivseid tehnoloogiaid ja kõige värskemaid saadaolevaid andmestikke selleks, et parendada seni parimat tulemust eesti-inglise keelepaaril. Selles töös treenitakse eesti keelest inglise keelde parimat tõlkekvaliteeti pakkuv masintõlkemudel, mis ületab ka varasema parima tulemuse. Soovitud eesmärgi saavutamiseks kasutatakse erinevaid meetodeid - treenitakse paralleelsetel andmetel põhinev baasmudel, sünteesitakse saadaolevate monokeelsete andmete ja tagasitõlke abil uus andmestik, kombineeritakse esialgne paralleelandmestik uue sünteetilise andmestikuga, treenitakse mudel suurenenud paralleelkorpusel ning lõpuks komplekteeritakse need juba treenitud mudelid kokku.
Lõputöö keel
inglise
Lõputöö tüüp
Bakalaureus - Informaatika
Juhendaja(d)
Andre Tättar
Kaitsmise aasta
2021
 
PDF