arvutiteaduse instituudi lõputööderegister


Grammatiliste vigade parandamise meetodid väheste ressurssidega keeltele — sünteetilistel andmetel eeltreenimine ja ühekeelne zero-shot tõlge
Nimi Agnes Luhtaru
Kokkuvõte Me võrdleme kahte lähenemist, mida saab kasutada grammatiliste vigade parandamiseks iseseisvate süsteemidena, kuid ka veaparandusnäidetega edasi treenimiseks. Esimene meetod keskendub sünteetilistel andmetel eeltreenimisele, teine kasutab mitmekeelset masintõlget, et parandada vigu ühekeelse zero-shot tõlkega. Meie analüüs näitab, et mudel, mis on treenitud sünteetiliste andmetega on madala saagisega, kuid täpsus on hea. Mitmekeelse masintõlke käitumine on aga vastupidine, mudel parandab õigesti palju vigu, kuid teeb liialt ebavajalikke või vääraid muudatusi. Süsteemide häälestamine veaparandusnäidetega tõstab sünteetilistel andmetel treenitud mudeli saagist ja masintõlke mudeli täpsust. Kahe mudeli käitumine muutub sarnasemaks, kuid sünteetiliste andmetega mudeli täpsus jääb kõrgemaks ja saagis vaid veidi masintõlke mudeli saagisest alla, mistõttu on see kahest süsteemist kasutatavam.
Lõputöö keel inglise
Lõputöö tüüp Magister - Informaatika
Juhendaja(d) Mark Fišel
Kaitsmise aasta 2022
PDF