arvutiteaduse instituudi lõputööderegister


Eestikeelsete tekstide sisukokkuvõtja EstSum edasiarendamine
Nimi Janar Saks
Kokkuvõte Tänapäevaste informatsioonihulkade juures on sageli vaja saada kiiresti ülevaade olulisest informatsioonist. Seepärast võiks rakenduse poolt automaatselt genereeritud sisukokkuvõte kui lühendatud kiiresti kättesaadav ülevaade algallikast olla oluline informatsiooni kogumise vahend. Kuid nagu iga keeletehnoloogiline rakendus, sõltub see sihtkeele omapäradest, mille jaoks see on disainitud. Inglise keele tarbeks loodud sisukokkuvõtja ei sobi eesti keele jaoks, sest eesti keelele omane sõnavormide rohkus vajab hoopis teistsugust lähenemist.
Kuigi eestikeelsete tekstide kokkuvõtja EstSum kasutab lause kaalu arvutamisel võtmesõnade põhist skoori, siis skoori arvutatakse sõnavormide, mitte sõnade algvormide pealt. EstSumi ühendamine lingvistilise mooduliga, mis suudab analüüsida sõnade algvorme, tõstis kokkuvõtja tulemuslikkust võrreldes EstSumiga, millel vastav moodul puudub.
Töö tulemusena valminud automaatse kokkuvõtja uus versioon suudab eraldada rohkem olulist informatsiooni algallikast, kui seda tegi EstSumi vana versioon.
Lõputöö keel eesti
Lõputöö tüüp Bakalaureus - Informaatika
Juhendaja(d) Kaili Müürisep
Kaitsmise aasta 2018
PDF