arvutiteaduse instituudi lõputööderegister


Rakendusi klassifitseerivate tunnuste eraldamine nende kirjeldustest
Nimi Elizaveta Yankovskaya
Kokkuvõte Aasta aastalt on kasvanud bioinformaatikas kasutatavate rakenduste arv.
Selle tulemusena on konkreetse ülesande lahendamiseks sobiliku rakenduse leidmine muutunud keerukaks ülesandeks.
Rakenduste kirjelduste paremaks süstematiseerimiseks ja otsitavaks muutmiseks on kasutusele võetud erinevaid märksõnade ontoloogiaid.
Hetkel annoteeritakse kirjeldusi käsitsi, mis on ajamahukas ning ei anna alati õigeid tulemusi.
Antud töös kirjeldame uut annoteerimismeetodit, mis pakub automaatselt välja ühe või mitu märksõna kasutades selleks vaid tööriista vabatekstilist kirjeldust.
Selleks kasutab meie meetod uusimaid loomuliku keele töötlemise meetodeid nagu Dirichlet' peitlahutus (latent Dirichlet allocation) ja sõnade vektoresitust (word2vec).
Esmane võrdlus meie poolt välja pakutud algoritmi ja käsitsi saadud märgendusega näitab, et tulemused on paljulubavad.
Lõputöö keel inglise
Lõputöö tüüp Magister - Informaatika
Juhendaja(d) Sven Laur
Kaitsmise aasta 2017
PDF