arvutiteaduse instituudi lõputööderegister


Tunnuste lahtiharutamine kasutades variatsioonilisi autoenkoodereid
Nimi Kaarel Tark
Kokkuvõte Masinõppe mudelid, eriti närvivõrgud, on näidanud häid tulemusi erinevate piltide klassifitseerimisel. Nende mudelite õpitud omadused on sageli keerulised ja raskesti tõlgendatavad. Piltidelt interpreteeritavate ja maailma hästi kirjeldavate lahtiharutatud tunnuste õppimine on viis seletatavuse parandamiseks. Õpitud tunnust võib nimetada lahtiharutatuks, kui ta muudab ainult ühte omadust. Kui meil on pilt toolist, siis üks tunnus muudab selle suurust, kuid mitte midagi muud. Teine tunnus muudab tooli jala kuju, kuid mitte midagi muud. Beetavariatsioonilised autokodeerijad (β-VAE) on näidanud paljulubavaid tulemusi lahtiharutatud tunnuste leidmiseks. Kui andmeid on piisavalt, saab mudel ise õppida andmestikku kirjeldavaid tunnuseid. Pärast tunnuste õppimist saab kasutada väikest hulka märgendatud andmeid, et treenida täiendav mudel tegema mõnda ennustust. β-VAE arhitektuuride katsed on tehtud üldjuhul lihtsate tehislikult genereeritud piltidega, mille genereerimisel kasutatud tunnused on teada. Tavaliselt on kõik generatiivsed tegurid sõltumatud ja ka katsetes eeldatakse, et tunnuste arv on väike. Hiljuti avaldati uus andmestik, kus leidub tunnuseid mis ei ole sõltumatud (Boxheadi andmestik). Eksperimendid olemasolevate arhitektuuridega näitasid, et β-VAE arhitektuuril põhinevad mudelid ei tuvasta hästi väikeseid sõltuvaid tunnuseid. Käesoleva töö esimeses osas uurime β-VAE arhitektuuril põhinevate mudelite käitumist Boxheadi andmestikul. Esialgse uurimuse põhjal pakume välja uue arhitektuuri, et parandada sõltuvate tunnuste tuvastamist. Meie poolt pakutud arhitektuuri headuse hindamiseks võrdleme tema tulemusi β-VAE arhitektuuril põhinevate mudelitega. Lisaks enimkasutatavatele mõõdikutele defineerime kaks uut mõõdikut hindamaks tunnuste headust. Meie tulemused ei näidanud olulist erinevust sõltuvate tunnuste tuvastamisel meie poolt välja pakutud arhitektuuri ja β-VAE vahel. Põhikatsete tulemuste põhjal viime läbi täiendavad katsed andmestikul, kus objekt ei pöörle.
Lõputöö keel inglise
Lõputöö tüüp Magister - Andmeteadus
Juhendaja(d) Meelis Kull
Kaitsmise aasta 2022
PDF