Kooskõlatingimustest lähtuv märgendusvigade tuvastamine

Organisatsiooni nimi
EstNLTK
Kokkuvõte
Enamike faktieraldusmeetodite väljund peab olema kooskõlas lause süntaks ja morfoloogiaga. Näiteks geograafiline asukoht on enamasti kohafraasi alamosa ja mitmeosalise nimetuse osad saavad olla vaid loetud käänetes. Kuna eestikeele jaoks on olemas üsna täpne süntaksianalüüsi töövoog, siis saab olemasolevaid faktieraldusmeetodeid testida märgendamata koondkorpuse peal ning moodustada leitud ebakõladest täiendav treeningandmestik.
See lähenemine on unikaalne, sest nii on võimalik tuvastada harva esinevaid olulisi konstruktsioone ja reegleid, mida tavaline näitepõhine treenimine ei võimalda. Töö eesmärk on luua raamistik tüüpiliste ebakõlade tuvastamiseks nimeolemi tuvastamise näitel ning hinnata selle lähenemise efektiivsust.
Lõputöö kaitsmise aasta
2023-2024
Juhendaja
Sven Laur
Suhtlemiskeel(ed)
eesti keel
Nõuded kandideerijale
Tase
Magister
Märksõnad

Kandideerimise kontakt

 
Nimi
Sven Laur
Tel
E-mail
sven.laur@ut.ee