Eeltreenitud neuromasintõlke mudelite efektiivne kasutamine

Nimi
Taido Purason
Kokkuvõte
Kuna järjest enam eeltreenitud keelemudeleid ja neuromasintõlke (NMT) mudeleid on vabalt kättesaadavad, on oluline uurida, kuidas neid kasutada uute mudelite treenimisel, et vältida ressursimahukat nullist treenimist. Käesolev töö uurib, kuidas eeltreenitud mudeleid tõhusalt kasutada, keskendudes erinevate eeltreenitud NMT mudelite komponentide kombineerimisele. Erinevate mudelite komponente pole otseselt ilma muutmata võimalik kombineerida, kuna kahe sõltumatu NMT mudeli lausete vektoresitused ei ole ühilduvad. Töös pakutakse välja meetod, kus esmalt lisatakse eeltreenitud kodeerijale mõõtme adapter, kui kodeerija ja dekodeerija omavad erinevaid vektoresituse mõõtmeid, ning seejärel täiendavaid kodeerijakihte. Meetodi demonstreerimiseks kombineeritakse 202 keelt toetava mitmekeelse NMT mudeli kodeerija ja eesti keele spetsiifilise NMT mudeli dekodeerija ning vaadeldakse tõlget eesti keelde. Tulemused näitavad olulist võitu nii tõlkekvaliteedis kui -kiiruses võrreldes mitmekeelse baasmudeliga. Lisaks demonstreeritakse edukalt võimekust treenida kiiresti kvaliteetne NMT süsteem eesti-ukraina ja ukraina-eesti tõlke jaoks, saavutades konkurentsivõimelisi tulemusi võrreldes varasemate töödega. Üldisemalt näitab lõputöö, et kahe sõltumatu NMT mudeli komponendid saab muuta ühilduvaks, sealjuures muutmata eeltreenitud parameetreid ja ohverdamata tõlkekvaliteeti.
Lõputöö keel
inglise
Lõputöö tüüp
Magister - Informaatika
Juhendaja(d)
Andre Tättar
Kaitsmise aasta
2023
 
PDF