Tõlkekvaliteedi hindamine

Nimi
Karol Toompalu
Kokkuvõte
Enamus kvaliteedi meetrikaid annab ainult mingi numbrilise väärtuse ette määratud vahemikust, andes masintõlkesüsteemide arendajate ainult üldise hinnangu süsteemi kvaliteedi suhtes, täpsustamata milliseid vigu analüüsi jooksul kohati. Käesoleva töö käigus prooviti lahendada seda mureküsimust - millist tüüpi vigu teeb süsteem tõlkimisel. Probleemi lahendamisel püüti säilitada keelest sõltumatust, mis omakorda seadis piiranguid programmi võimekusele teatud veatüüpe tuvastada. Näiteks ei saa keelespetsiifilisi andmeid omamata seada vastavusse inimtõlke ja masintõlke sõnu, mis ei ole sarnased. Töö lahenduse käigus prooviti läbi erinevaid lähenemisviise. Lõpuks jäi peale täielik keelest sõltumatuse nõue ehk loobuti morfoloogilise info kasutamisest ning arvutati keelest sõltumatult hinnangud erinevate vigade esinemise sagedustest. Programm suutis talle pandud eesmärke täita ning annab üpris adekvaatset statistikat süsteemi vigade kohta. Masintõlge on väga oluline paljudele inimestele, selle abil saab kasutaja ligikaudese tõlke abil teksti sisust, mille jaoks oleks vaja muidu lingvisti. Kuna masintõlge on oluline, on ka selle arendamine oluline. Selleks on vaja süsteemi väljundit hinnata mingite kriteeriumite alusel. Alati on seda võimalik käsitsi teha, kuid see on aega ja ressurssi nõudev. Selleks on välja arendatud palju automaatsed hindamise meetrikad. Levinum neist on BLEU, mis hindab süsteemi tõlke ja näidistõlke korreleerumist. Veaanalüüs on siiski veel üsna uurimata ala ning loodetavasi sai töö autor anda oma panuse selle hüvanguks
Lõputöö keel
eesti
Lõputöö tüüp
Magister - Infotehnoloogia
Juhendaja(d)
Mark Fišel
Kaitsmise aasta
2011
 
PDF Lisad