Masinõppe abil mittekodeerivate geneetiliste variantide mõju hindamine transkriptsioonifaktorite seondumisele
Nimi
Yurii Toma
Kokkuvõte
Inimorganismi toimimispõhimõtetest arusaamine on üks tänapäeva teaduse suurimaid väljakutseid. Esimese inimgenoomi sekveneerimise järgselt on palju resursse kulutatud DNA sekventsi ja selle varieeruvuse uurimiseks. Nendest jõupingutustest hoolimata ei saa me paljudest inimorganismis toimuvatest olulistes protsessidest endiselt väga hästi aru. Üks selliseid protsesse on mittekodeerivate geneetiliste variantide mõju hindamine inimese genoomis. Sellised geneetilised variandid, kui neil üldse peaks mingi mõju olema, mõjutavad suure tõenäosusega transkriptsioonifaktorite seondumist.
Suur hulk erinevaid meetodeid on välja töötatud ennustamaks geneetiliste variantide mõju transkriptsioonifaktorite seondumisele. Täpsete testandmestike puudumise tõttu on aga nende meetodite täpsuse hindamine olnud raskendatud ja seetõttu on enamasti lähtutud kaudsetest mõõdikutest.
Oma töös panen ma kokku kolm suurt geneetilist andmestikku, et kindlaks teha suur hulk geneetilisi variante, mis suure tõenäosusega mõjutavad põhjuslikult kahe transkriptsioonifaktori (CTCF ja PU.1) seondumist DNAle.
Järgnevalt kasutan ma neid geneetilisi variante hindamaks kolme kaasaegse ennustusalgoritmi täpsust.
Minu tulemused näitavad, et kuigi mõne suure mõjuga geneetilise variandi efekti hindamine on võimalik, jääb enamiku väiksema mõjuga variantide mõju kindlaks tegemata. See lähenemine on üldistatav teistele transkriptsioonifaktoritele ja seda saab kasutada uudsete ennustusalgoritmide täpsuse paremaks hindamiseks tulevikus.
Suur hulk erinevaid meetodeid on välja töötatud ennustamaks geneetiliste variantide mõju transkriptsioonifaktorite seondumisele. Täpsete testandmestike puudumise tõttu on aga nende meetodite täpsuse hindamine olnud raskendatud ja seetõttu on enamasti lähtutud kaudsetest mõõdikutest.
Oma töös panen ma kokku kolm suurt geneetilist andmestikku, et kindlaks teha suur hulk geneetilisi variante, mis suure tõenäosusega mõjutavad põhjuslikult kahe transkriptsioonifaktori (CTCF ja PU.1) seondumist DNAle.
Järgnevalt kasutan ma neid geneetilisi variante hindamaks kolme kaasaegse ennustusalgoritmi täpsust.
Minu tulemused näitavad, et kuigi mõne suure mõjuga geneetilise variandi efekti hindamine on võimalik, jääb enamiku väiksema mõjuga variantide mõju kindlaks tegemata. See lähenemine on üldistatav teistele transkriptsioonifaktoritele ja seda saab kasutada uudsete ennustusalgoritmide täpsuse paremaks hindamiseks tulevikus.
Lõputöö keel
inglise
Lõputöö tüüp
Magister - Informaatika
Juhendaja(d)
Kaur Alasoo, Dmytro Fishman
Kaitsmise aasta
2018