Grammatiliste vigade parandamise meetodid väheste ressurssidega keeltele — sünteetilistel andmetel eeltreenimine ja ühekeelne zero-shot tõlge

Nimi
Agnes Luhtaru
Kokkuvõte
Me võrdleme kahte lähenemist, mida saab kasutada grammatiliste vigade parandamiseks iseseisvate süsteemidena, kuid ka veaparandusnäidetega edasi treenimiseks. Esimene meetod keskendub sünteetilistel andmetel eeltreenimisele, teine kasutab mitmekeelset masintõlget, et parandada vigu ühekeelse zero-shot tõlkega. Meie analüüs näitab, et mudel, mis on treenitud sünteetiliste andmetega on madala saagisega, kuid täpsus on hea. Mitmekeelse masintõlke käitumine on aga vastupidine, mudel parandab õigesti palju vigu, kuid teeb liialt ebavajalikke või vääraid muudatusi. Süsteemide häälestamine veaparandusnäidetega tõstab sünteetilistel andmetel treenitud mudeli saagist ja masintõlke mudeli täpsust. Kahe mudeli käitumine muutub sarnasemaks, kuid sünteetiliste andmetega mudeli täpsus jääb kõrgemaks ja saagis vaid veidi masintõlke mudeli saagisest alla, mistõttu on see kahest süsteemist kasutatavam.
Lõputöö keel
inglise
Lõputöö tüüp
Magister - Informaatika
Juhendaja(d)
Mark Fišel
Kaitsmise aasta
2022
 
PDF