Soome-ugri väikeste keelte neuromasintõlke edendamine

Nimi
Maali Tars
Kokkuvõte
Hea neuromasintõlke mudeli treenimiseks on vaja palju andmeid. Väiksema levikuga keeltele aga ei leidu tavaliselt piisavalt andmeid, et treenida mudelit, mis on sama kvaliteetne kui paljude andmetega treenitud mudelid.
Üks lahendus sellele probleemile on treenida mitmekeelne mudel, kus on koos paljude andmete ja väheste andmetega keeled, luues sellega ühise sõnavara ning õppimise ruumi. Niimoodi õpivad mudelid tõlkima väiksema levikuga keeli rohkete andmetega keelte abil.
Teine võimalus selle probleemi lahendamiseks on kasutada meetodit, kus tõlgitakse ühekeelsed andmed baasmudeli abil teise keelde. Tulemuseks on sünteetilised kahekeelsed andmed, mida saab kasutada uue mudeli treenimiseks. Siin töös treenime soome-ugri keeltega mitmekeelse mudeli ning toodame selle peal ühekeelsetest andmetest sünteetilisi andmeid, et edendada väikese andmemahuga soome-ugri keelte masintõlget.
Lõputöö keel
inglise
Lõputöö tüüp
Bakalaureus - Informaatika
Juhendaja(d)
Andre Tättar
Kaitsmise aasta
2021
 
PDF