Simulatsioonist pärismaailma üldistumine masinnägemises kasutades domeenikohandamist, stiili randomeerimist ja mitme ülesande õppimist

Nimi
Hannes Liik
Kokkuvõte
Juhendamisega sügavõpe on viimastel aastatel olnud väga edukas masinnägemise ülesannetes. Selle saavutamiseks on vaja suurt hulka märgendatud andmeid. Käsitsi suurte andmestike annoteerimine võib olla väga kulukas. Semantiline segmenteerimine, ehk piltide pikslite klassifitseerimine, on näide ülesandest, mis vajab eriti töömahukat pikslitäpsusega märgendamist. Üks viis hoiduda käsitsi märgendamisest on kasutada simulatsiooni, mis teeb seda automaatselt. Praktika on aga näidanud, et simulatsiooni andmetel treenitud mudelid ei üldistu pärismaailma. Käesolevas töös uuritakse kolme meetodit, kuidas suurendada semantilise segmentatsiooni tehisnärvivõrkude üldistuvust simulatsioonist pärismaailma. Esiteks uuritakse generatiivse tehisnärvivõrgu kasutamist, et muuta andmestiku väljanägemist realistlikumaks (domeenikohandamine). Tulemused näitavad, et see meetod on efektiivne siis, kui pärismaailma keskkond on sarnane simulatsioonile. Teiseks uuritakse stiilide varieerimist, et muuta segmenteerimise närvivõrku vähem tundlikuks visuaalsetele muutustele. Stiilirandomeerimist kasutades üldistus treenitud tehisnärvivõrk ka keskkondadele, mis ei sarnane simulatsioonile. Kolmandaks katsetati lisaks segmentatsioonile ka pikslite sügavuse ennustamist lisaülesandena. Praktikas oli mitme ülesande korraga treenimist raske tööle saada ning näitas vähest kasu.
Lõputöö keel
inglise
Lõputöö tüüp
Magister - Informaatika
Juhendaja(d)
Tambet Matiisen
Kaitsmise aasta
2020
 
PDF