arvutiteaduse instituudi lõputööderegister


Neuromasintõlke mudelite täiustamine tagasitõlke ja tõlkekvaliteedi hindamise meetoditega
Nimi Raul Erik Kattai
Kokkuvõte Parimad masintõlke mudelid väljastavad väga kõrge kvaliteediga tõlkeid, mida on raske eristada inimtõlgitud tekstidest. Tõlkemudelist heade tulemuste saamiseks vaja palju treeningandmeid. Kasulikke kahendkeelseid korpuseid on piiratud koguses ja eriti keelte, mis on vähem levinud, jaoks. Rohkemate treeningandmete saamiseks saab ühekeelsetele korpustele mudeliga juurde genereerida lausete vasteid teises keeles. Selline sünteetiline kahendkeelne andmestik on madalama kvaliteedi tõttu vähem kasulik ja võib mudelit halvemaks õpetada. See bakalaureusetöö rakendab sünteetilisele andmestikule tõlkekvaliteedi hindamise mudelit, mille tulemus aitab paremad tõlked välja valida, et nendega tõlkemudelit edasi treenida. Protsessi eesmärk on kasutada ühekeelseid korpuseid, et masintõlke mudelit paremaks muuta.
Lõputöö keel inglise
Lõputöö tüüp Bakalaureus - Informaatika
Juhendaja(d) Andre Tättar
Kaitsmise aasta 2021
PDF