Mitme-domeenne tehisnärvivõrkudel põhinev masintõlge

Nimi
Sander Tars
Kokkuvõte
Käesolev magistritöö kätkeb endas neurotõlke lähenemist, mis toetab
mitme-domeenseid tekste ja võimaldab tõlkimisel arvestada domeenide eripära. Antud lähenemine lähtub põhimõttest, et me käsitleme domeene kui eraldiseisvaid keeli, ning kasutame nende tõlkimiseks mitmekeelse neurotõlke meetodeid. Samuti näitame et mainitud lähenemise tulemusena tõlkekvaliteedi hinnang paraneb märgatavalt.
Käesolevas töös pakume välja ka lähenemise domeenide automaatseks määramiseks ja uurime, kas eelnev domeenijaotuse info on üldse vajalik. Tuleb välja, et on, kuid kui sellist infot ei ole, on automaatset määramist kasutades võimalik samuti kõrge tõlkekvaliteedini jõuda, kohati isegi kõrgemani, kui eelnevat domeenijaotuse infot kasutades.
Lisaks uurime selles töös, kas keelesisene stiilile kohandamine tühipauk (zero-shot) tõlke kaudu on võimalik. Näitame, et see lähenemine on võimeline stiilile kohanduma, kuid koos siiani lahenduseta kvaliteedilangusega.
Lõputöö keel
inglise
Lõputöö tüüp
Magister - Informaatika
Juhendaja(d)
Mark Fišel, PhD
Kaitsmise aasta
2018
 
PDF