Arvutiteaduse instituut - lõputööde register

Valminud lõputööd (sisestamine) Lõputööde teemad (sisestamine)

Tõlkekvaliteedi hindamine

Nimi

Karol Toompalu

Kokkuvõte

Enamus kvaliteedi meetrikaid annab ainult mingi numbrilise väärtuse ette määratud vahemikust, andes masintõlkesüsteemide arendajate ainult üldise hinnangu süsteemi kvaliteedi suhtes, täpsustamata milliseid vigu analüüsi jooksul kohati. Käesoleva töö käigus prooviti lahendada seda mureküsimust - millist tüüpi vigu teeb süsteem tõlkimisel. Probleemi lahendamisel püüti säilitada keelest sõltumatust, mis omakorda seadis piiranguid programmi võimekusele teatud veatüüpe tuvastada. Näiteks ei saa keelespetsiifilisi andmeid omamata seada vastavusse inimtõlke ja masintõlke sõnu, mis ei ole sarnased. Töö lahenduse käigus prooviti läbi erinevaid lähenemisviise. Lõpuks jäi peale täielik keelest sõltumatuse nõue ehk loobuti morfoloogilise info kasutamisest ning arvutati keelest sõltumatult hinnangud erinevate vigade esinemise sagedustest. Programm suutis talle pandud eesmärke täita ning annab üpris adekvaatset statistikat süsteemi vigade kohta. Masintõlge on väga oluline paljudele inimestele, selle abil saab kasutaja ligikaudese tõlke abil teksti sisust, mille jaoks oleks vaja muidu lingvisti. Kuna masintõlge on oluline, on ka selle arendamine oluline. Selleks on vaja süsteemi väljundit hinnata mingite kriteeriumite alusel. Alati on seda võimalik käsitsi teha, kuid see on aega ja ressurssi nõudev. Selleks on välja arendatud palju automaatsed hindamise meetrikad. Levinum neist on BLEU, mis hindab süsteemi tõlke ja näidistõlke korreleerumist. Veaanalüüs on siiski veel üsna uurimata ala ning loodetavasi sai töö autor anda oma panuse selle hüvanguks

Lõputöö keel

eesti

Lõputöö tüüp

Magister - Infotehnoloogia

Juhendaja(d)

Mark Fišel

Kaitsmise aasta

2011

PDF Lisad

TÜ arvutiteaduse instituudi lõputööde register

Tõlkekvaliteedi hindamine