arvutiteaduse instituudi lõputööderegister


Arvuti sõnastike seletuste automaatne genereerimine ja kontrollimine Eesti Wordneti näitel
Nimi Kristo Markov
Kokkuvõte Käesoleva töö eesmärk oli automaatselt genereerida seletusi Eesti Wordneti neile mõistetele, millel seletused puuduvad. Töö teoreetilises osas kirjeldatakse arvuti leksikonide ajalugu ning antakse ülevaade wordnet-tüüpi leksikonide põhimõtetest. Täpsemalt kirjeldatakse Eesti Wordneti loomist, sisu ja erinevaid probleeme. Lisaks seletatakse, kuidas koostada ja formaliseerida sõnaseletust.

Töö praktilise osa tulemusena valmis programm, mis genereerib neljal erineval meetodil seletusi mõistetele, millel Eesti Wordnetis need puuduvad. Praktilise osa käigus jõuti järelduseni, et seletusi on võimalik genereerida, kuid kõik genereeritud seletused tuleb üle kontrollida, sest ükski meetod ei andnud 100% korrektset seletust. Kokku genereeriti 11 075 sõnaseletust 18 731 puuduvast seletusest. Kõige rohkem seletusi (5469 seletust ehk ligi 50% seletustest) genereeriti unikaalse sünohulga liikme põhjal. Kõige parema täpsusega töötasid sarnasuse (91% seletustest sobis) ning unikaalse sünohulga liikme meetodid (84% seletustest sobis).
Lõputöö keel eesti
Lõputöö tüüp Bakalaureus - Informaatika
Juhendaja(d) Heili Orav, Indrek Jentson
Kaitsmise aasta 2022
PDF