DNA mutatsiooniliste signatuuride õppimine tehisnärvivõrkude abil

Nimi
Lauri Tammeveski
Kokkuvõte
Kõik pahaloomulised vähkkasvajad on põhjustatud organismi rakkudes
toimuvate mutatsioonide poolt. On leitud, et need mutatsioonid
on moodustatud spetsiifiliste mustrite ehk signatuuride kombinatsioonist,
mille aluseks olevad protsessid on tihti teada. Seetõttu on nende
signatuuride õppimine andmetest väga tähtis — see võib anda paremat
informatsiooni vähkkasvajate mehhanismide kohta ja olla abiks
vähi ennetamisel ja teraapial. Antud töö eesmärk on testida ja võrrelda
erinevaid metoodikaid, et parandada mutatsiooniliste signatuuride
leidmist. Me võrdlesime kolme uut meetodit — tehis-närvivõrgud
(NN), mittenegatiivsed faktorvõrgud (RFN) ja teemade modelleerimine
— praegu kasutatava mittenegatiivse maatriksi faktoriseerimisega
(NMF). Me eksperimenteerisime meetoditega kolmel orgaanilisel ja kolmel
sünteetilisel andmestikul ning mõõtsime rekonstrueerimise viga, tulemuse
hõredust ja arvutusteks kulunud aega. Tulemused näitavad, et
NMF annab väikseima veaga tulemuse kergematel andmestikel, kuid ka
RFN-i tulemus on ligilähedane ning kõikidel teistel andmestikel saavutab
see parema tulemuse. NN esineb sama hästi kui RFN keerulisematel
andmestikel ning lisaks saavutab üleüldiselt kõige hõredamad tulemused.
NMF-i eeliseks on stabiilsuse arvutamise funktsionaalsus, mis väga
täpselt suudab määrata õige signatuuride arvu. Tulevikus tuleb teha
edasist arendustööd, et sarnane võimekus ka RFN ja NN meetoditele
lisada, mille järel oleks võimalik nende praktiline kasutamine mutatsiooniliste
signatuuride õppimisel.
Lõputöö keel
inglise
Lõputöö tüüp
Magister - Informaatika
Juhendaja(d)
Raul Vicente Zafra, Leopold Parts, Tambet Matiisen, Ardi Tampuu
Kaitsmise aasta
2016
 
PDF