Dialoogiaktide märgendamine Eesti dialoogikorpuses: ülevaade ressurssidest ja tarkvaraarendus
Nimi
Sven Aller
Kokkuvõte
Magistritöö eesmärgiks on kirjeldada Eesti dialoogikorpuse ressursside hetkeolukorda ja dialoogide märgendamiseks kasutatavaid vahendeid ning arendada edasi poolautomaatset märgendajat DAREC.
Töös on kirjeldatud dialoogide ülesehitust, Eestis kasutatavat dialoogiaktide märgendamis-tüpoloogiat EDiT, samuti nii manuaalse kui ka automaatse märgendamistarkvara positiivseid ja negatiivseid külgi.
2007. aastal Mark Fišeli poolt loodud dialoogiaktide poolautomaatne märgendaja DAREC põhineb statistilisel meetodil. Esimeste testijate hinnangud olid küllaltki positiivsed seoses DARECi töö sisuliste tulemustega, kuna see kergendas oluliselt isegi väiksema täpsusega tuvastamise puhul õigete märgendite leidmist kuid negatiivsed seoses kasutajaliidesega. Viimasele heideti ette ebamugavust, ebapiisavat abiinfot, mõnede vajalike operatsioonide puudumist jms. Nende arvamuste põhjal kõrvaldati või leevendati käesoleva töö raames nimetatud puudusi, võttes aluseks heade kasutajaliideste loomise põhimõtted. Seejärel paluti dialoogide märgendajatel testida uut kasutajaliidest ning hinnangutest selgus, et süsteemi kasutajamugavus on olulisel määral kasvanud. Kõrgeimalt hinnati kasutajapärasust ja disaini ning kontekstitundlikku abiinfot, kuid samuti esitati erinevaid ideid süsteemi efektiivsemaks muutmiseks.
Töös tuuakse ka võimalusi DARECi edasi¬arendamiseks: tuvastamistäpsuse ja saagise tõstmine algoritmi parandamise ja dialoogikorpuse suurenda¬mise läbi, ekspertvõimaluste lisamine jne.
Lõputöö keel
eesti
Lõputöö tüüp
Magister - Informaatika
Juhendaja(d)
Mare Koit
Kaitsmise aasta
2012