Arvutiteaduse instituut - lõputööde register

Valminud lõputööd (sisestamine) Lõputööde teemad (sisestamine)

Soome-ugri väikeste keelte neuromasintõlke edendamine

Nimi

Maali Tars

Kokkuvõte

Hea neuromasintõlke mudeli treenimiseks on vaja palju andmeid. Väiksema levikuga keeltele aga ei leidu tavaliselt piisavalt andmeid, et treenida mudelit, mis on sama kvaliteetne kui paljude andmetega treenitud mudelid.
Üks lahendus sellele probleemile on treenida mitmekeelne mudel, kus on koos paljude andmete ja väheste andmetega keeled, luues sellega ühise sõnavara ning õppimise ruumi. Niimoodi õpivad mudelid tõlkima väiksema levikuga keeli rohkete andmetega keelte abil.
Teine võimalus selle probleemi lahendamiseks on kasutada meetodit, kus tõlgitakse ühekeelsed andmed baasmudeli abil teise keelde. Tulemuseks on sünteetilised kahekeelsed andmed, mida saab kasutada uue mudeli treenimiseks. Siin töös treenime soome-ugri keeltega mitmekeelse mudeli ning toodame selle peal ühekeelsetest andmetest sünteetilisi andmeid, et edendada väikese andmemahuga soome-ugri keelte masintõlget.

Lõputöö keel

inglise

Lõputöö tüüp

Bakalaureus - Informaatika

Juhendaja(d)

Andre Tättar

Kaitsmise aasta

2021

PDF

TÜ arvutiteaduse instituudi lõputööde register

Soome-ugri väikeste keelte neuromasintõlke edendamine