arvutiteaduse instituudi lõputööderegister


Soome-ugri väikeste keelte neuromasintõlke edendamine
Nimi Maali Tars
Kokkuvõte Hea neuromasintõlke mudeli treenimiseks on vaja palju andmeid. Väiksema levikuga keeltele aga ei leidu tavaliselt piisavalt andmeid, et treenida mudelit, mis on sama kvaliteetne kui paljude andmetega treenitud mudelid.
Üks lahendus sellele probleemile on treenida mitmekeelne mudel, kus on koos paljude andmete ja väheste andmetega keeled, luues sellega ühise sõnavara ning õppimise ruumi. Niimoodi õpivad mudelid tõlkima väiksema levikuga keeli rohkete andmetega keelte abil.
Teine võimalus selle probleemi lahendamiseks on kasutada meetodit, kus tõlgitakse ühekeelsed andmed baasmudeli abil teise keelde. Tulemuseks on sünteetilised kahekeelsed andmed, mida saab kasutada uue mudeli treenimiseks. Siin töös treenime soome-ugri keeltega mitmekeelse mudeli ning toodame selle peal ühekeelsetest andmetest sünteetilisi andmeid, et edendada väikese andmemahuga soome-ugri keelte masintõlget.
Lõputöö keel inglise
Lõputöö tüüp Bakalaureus - Informaatika
Juhendaja(d) Andre Tättar
Kaitsmise aasta 2021
PDF