Eestikeelsete tekstide sisukokkuvõtja EstSum edasiarendamine

Nimi
Janar Saks
Kokkuvõte
Tänapäevaste informatsioonihulkade juures on sageli vaja saada kiiresti ülevaade olulisest informatsioonist. Seepärast võiks rakenduse poolt automaatselt genereeritud sisukokkuvõte kui lühendatud kiiresti kättesaadav ülevaade algallikast olla oluline informatsiooni kogumise vahend. Kuid nagu iga keeletehnoloogiline rakendus, sõltub see sihtkeele omapäradest, mille jaoks see on disainitud. Inglise keele tarbeks loodud sisukokkuvõtja ei sobi eesti keele jaoks, sest eesti keelele omane sõnavormide rohkus vajab hoopis teistsugust lähenemist.
Kuigi eestikeelsete tekstide kokkuvõtja EstSum kasutab lause kaalu arvutamisel võtmesõnade põhist skoori, siis skoori arvutatakse sõnavormide, mitte sõnade algvormide pealt. EstSumi ühendamine lingvistilise mooduliga, mis suudab analüüsida sõnade algvorme, tõstis kokkuvõtja tulemuslikkust võrreldes EstSumiga, millel vastav moodul puudub.
Töö tulemusena valminud automaatse kokkuvõtja uus versioon suudab eraldada rohkem olulist informatsiooni algallikast, kui seda tegi EstSumi vana versioon.
Lõputöö keel
eesti
Lõputöö tüüp
Bakalaureus - Informaatika
Juhendaja(d)
Kaili Müürisep
Kaitsmise aasta
2018
 
PDF