Arvuti sõnastike seletuste automaatne genereerimine ja kontrollimine Eesti Wordneti näitel

Nimi
Kristo Markov
Kokkuvõte
Käesoleva töö eesmärk oli automaatselt genereerida seletusi Eesti Wordneti neile mõistetele, millel seletused puuduvad. Töö teoreetilises osas kirjeldatakse arvuti leksikonide ajalugu ning antakse ülevaade wordnet-tüüpi leksikonide põhimõtetest. Täpsemalt kirjeldatakse Eesti Wordneti loomist, sisu ja erinevaid probleeme. Lisaks seletatakse, kuidas koostada ja formaliseerida sõnaseletust.

Töö praktilise osa tulemusena valmis programm, mis genereerib neljal erineval meetodil seletusi mõistetele, millel Eesti Wordnetis need puuduvad. Praktilise osa käigus jõuti järelduseni, et seletusi on võimalik genereerida, kuid kõik genereeritud seletused tuleb üle kontrollida, sest ükski meetod ei andnud 100% korrektset seletust. Kokku genereeriti 11 075 sõnaseletust 18 731 puuduvast seletusest. Kõige rohkem seletusi (5469 seletust ehk ligi 50% seletustest) genereeriti unikaalse sünohulga liikme põhjal. Kõige parema täpsusega töötasid sarnasuse (91% seletustest sobis) ning unikaalse sünohulga liikme meetodid (84% seletustest sobis).
Lõputöö keel
eesti
Lõputöö tüüp
Bakalaureus - Informaatika
Juhendaja(d)
Heili Orav, Indrek Jentson
Kaitsmise aasta
2022
 
PDF