Väheste ressurssidega soome-ugri keelte neuromasintõlge keeltevahelise siirdeõppe abil

Nimi
Maali Tars
Kokkuvõte
Esimesed kvaliteetsed masintõlke mudelid treeniti enamasti suurte keelte peal nagu inglise või saksa keel. Hiljutine suundumus on aga arendada ka väikeste ressurssidega keeltele head masintõlget. Enamik soome-ugri keeltest on just nimelt väheste ressurssidega ning vajavad masintõlke treenimiseks erinevaid tehnikaid ning suurte keelte andmeid, millelt tõlkeprotsessis kasulikku infot saada. Selles töös kasutame mitmekeelseid eeltreenitud masintõlke mudeleid, mida saab peenhäälestada soovitud keeltele. Suur osa siin töös osalevatest soome-ugri keeltest ei kaasatud eeltreenitud mudelite treenimisprotsessi, nii et peame kasutama keeltevahelist siirdeõpet. Lisaks sünteesime andmeid juurde tagasitõlkimise abil, et leevendada andmevähesuse probleemi, mis väheste ressurssidega keeltega kaasneb. Me treenime mitmeid mudeleid erineva seadistusega, et saada teada, mis situatsioon valitud soome-ugri keeltele sobib. Näitame, et parandame tulemust kõikidel väikeste soome-ugri keelepaaridel ning mitme soome-ugri keele jaoks avaldame nende esimese närvivõrkudel põhineva masintõlke mudeli.
Lõputöö keel
inglise
Lõputöö tüüp
Magister - Informaatika
Juhendaja(d)
Andre Tättar
Kaitsmise aasta
2023
 
PDF