Tervisesündmuste üldistamine sõnavektorite abil
Nimi
Kermo Saarse
Kokkuvõte
Tervishoiusüsteemis võib iga arstivisiit tekitada mitmeid andmepunkte. Sama terviseprobleemiga võivad olla seotud mitmed diagnoosid, ravimi väljakirjutused ja mõõtmised, mis kõik on erinevad sündmused. Andmete detailsus teeb aga nende analüüsimise keerukaks. Selles töös agregeeritakse üksteisega seotud tervisesündmused üldistatud sündmusteks, kasutades word2vec mudelit ja K-means klasterdamist ning demonstreeritakse seda OMOP CDM formaadis andmestikul. Tulemused näitavad, et word2vec suudab edukalt tuvastada sisult sarnaseid tervisesündmusi. Mida rohkem tekitada klastreid, seda ühetaolisem on klastrite sisu, kuid seda rohkem on ka üksteisega sarnaseid klastreid. Üldistamise tulemusena vähenes oluliselt patsiendi andmestikus olevate sündmuste arv.
Lõputöö keel
eesti
Lõputöö tüüp
Magister - Andmeteadus
Juhendaja(d)
Sulev Reisberg
Kaitsmise aasta
2024