Jätkuv õpe mitmekeelses neuromasintõlkes

Nimi
Dmytro Kolesnykov
Kokkuvõte
Koos pidevalt kasvava tekstiandmete hulgaga on järjest olulisemaks saamas automaatsed tõlkesüsteemid. Enamik suuri ettevõtteid proovivad arendada oma tõlkemootoreid, et sellel alal võistelda. Järjest enam on tähtsamaks muutumas mitmekeelsed masintõlke mudelid, mis oskavad tõlkida kõikide keelte vahel. Selle lõputöö eesmärk on saavutada hea kvaliteediga tõlkesüsteem, mis jätkaks pidevat õppimist domeenipõhistel ühekeelsetel andmetel. Jätkuv õpe aitab tõsta mitmekeelse masintõlke süsteemi headust ja teabesiirde abil õppida tundmatuid keelepaare ilma lisamudeleid treenimata ja paralleelandmeid kogumata. Selles töös kirjeldan tagasitõlke kohandamise moodust jätkuva õppe jaoks - kuidas suurendada paralleelsete andmete hulka sünteetiliselt. Lõpetuseks esitan tulemused inglise, vene ja eesti keele jaoks kasutades ainult vabalt kättesaadavaid andmeid.
Lõputöö keel
inglise
Lõputöö tüüp
Magister - Informaatika
Juhendaja(d)
Andre Tättar, Mark Fišel
Kaitsmise aasta
2021
 
PDF