Neuromasintõlke mudelite täiustamine tagasitõlke ja tõlkekvaliteedi hindamise meetoditega

Nimi
Raul Erik Kattai
Kokkuvõte
Parimad masintõlke mudelid väljastavad väga kõrge kvaliteediga tõlkeid, mida on raske eristada inimtõlgitud tekstidest. Tõlkemudelist heade tulemuste saamiseks vaja palju treeningandmeid. Kasulikke kahendkeelseid korpuseid on piiratud koguses ja eriti keelte, mis on vähem levinud, jaoks. Rohkemate treeningandmete saamiseks saab ühekeelsetele korpustele mudeliga juurde genereerida lausete vasteid teises keeles. Selline sünteetiline kahendkeelne andmestik on madalama kvaliteedi tõttu vähem kasulik ja võib mudelit halvemaks õpetada. See bakalaureusetöö rakendab sünteetilisele andmestikule tõlkekvaliteedi hindamise mudelit, mille tulemus aitab paremad tõlked välja valida, et nendega tõlkemudelit edasi treenida. Protsessi eesmärk on kasutada ühekeelseid korpuseid, et masintõlke mudelit paremaks muuta.
Lõputöö keel
inglise
Lõputöö tüüp
Bakalaureus - Informaatika
Juhendaja(d)
Andre Tättar
Kaitsmise aasta
2021
 
PDF