Laborianalüüside diskretiseerimine ja analüüs

Nimi
Annika Talvet
Kokkuvõte
Patsientide kliiniliste analüüside tulemuste interpreteerimisel on olulised referentsvahemikud, mis määravad vahemiku, kuhu mõõtmise tulemus võiks jääda terve indiviidi puhul. Need vahemikud võivad sõltuda vanusest ja soost, aga ka konkreetses laboris kasutatavast analüüsimetoodikast. Referentsvahemike abil diskretiseeritud analüüsitulemusi on lihtsam kasutada andmete analüüsimisel ning mudelite treenimisel. Analüüsitulemuste puhul võib aga olla probleemiks seotus vale LOINC koodi või mõõtühikuga.
Magistritöö eesmärk on tuvastada valesti grupeeritud või vale ühikuga analüüse ning referentsvahemikke. Lisaks uurida, kas referentsvahemiku abil diskretiseeritud tulemustest on kasu tervisesündmuste ennustamisel ning kas ennustuse täpsusel on vahe erinevate diskretiseerimismeetodite kasutamisel.
Valesti grupeeritud analüüsitulemuste tuvastamiseks klasterdati andmed kasutades Gaussi segumudelit. Diskretiseeritud tulemuste ennustusvõime hindamiseks uuriti seoseid mõõtmisfaktide ning erinevatel meetoditel diskretiseeritud mõõtmiste ja tervisesündmuse esinemise vahel, lisaks treeniti mudelid tervisesündmuse esinemise prognoosimiseks.
Töö tulemusena selgus, et erinevaid sisendeid kasutavate mudelite ennustustäpsustel ei ole olulist vahet. Selline tulemus viitab asjaolule, et tervisesündmuse ennustamisel on mõõtmise toimumise fakt võrdväärne referentsväärtuste abil diskretiseeritud analüüsitulemusega.
Lõputöö keel
eesti
Lõputöö tüüp
Magister - Andmeteadus
Juhendaja(d)
Sven Laur
Kaitsmise aasta
2024
 
PDF