arvutiteaduse instituudi lõputööderegister


Eesti keele vana ja uue kirjaviisi teisendus lõplike muunduritega
Nimi Ida Maria Orula
Kokkuvõte Kaasajal on aktuaalne kõiksugu kirjalike allikate automatiseeritud analüüs. Analüüsiks kasutatavad infotehnoloogilised vahendid on aga edukalt rakendatavad üksnes sõnadele, mis on morfoloogilisel tasemel vastavuses tänapäevaste õigekirja normidega. Seega tuleb ajaloolisi tekste esmalt normaliseerida. Probleemile võib läheneda kahest suunast. Ühest küljest võib vanas kirjaviisis tekstid täielikult kaasaega tuua, asendades kõik vanapärased sõnavormid nende kaasaegsete vastetega. Nii on tekstid kaasaegsetele automaatanalüüsitehnoloogiatele arusaadavad ning ka inimestele kergesti loetavad, kuid kaduma läheb oluline info kunagise keelekasutuse kohta. Teine võimalus on muuta olemasolevaid keelt analüüsivaid vahendeid selliselt, et need oskaks ära tunda ka vanas kirjaviisis sõnavorme. Bakalaureusetöös kasutatakse mõlemat lähenemist. Võttes aluseks 1739. aasta Piibli teksti, kirjutatakse uus ortograafiamuundur, mis vastendab vanas kirjaviisis sõnu nende tänapäevaste kujudega. Lisaks kohandatakse olemasolevat eesti keele morfoloogiamuundurit vana kirjakeelega, et oleks võimalik säilitada sõnade tollane kuju, seostades neid siiski kaasaegsete sõnavormidega. Töös antakse ka näpunäiteid, kuidas alustatud lahendust tulevikus edasi arendama peaks.
Lõputöö keel eesti
Lõputöö tüüp Bakalaureus - Informaatika
Juhendaja(d) Heiki-Jaan Kaalep
Kaitsmise aasta 2019
PDF