Sisendandmete suuruse ja peenhäälestamise mõju Faster R-CNN-ile ülekandeõppega

Nimi
Wei Zheng
Kokkuvõte
Süvaõppemudeleid kasutatakse laialdaselt masinõppe ülesannete, näiteks objektide tuvastamise jaoks. Olemasolevate andmete puudumine nende mudelite treenimise on paljudes tööstusrakendustes ühine takistus, kus andmete kogumine/märgendamine ja ebapiisavad arvutusressursid takistavad sageli süvaõpperakenduste rahalist teostatavust. Ülekandeõpe on võimalik vastus sellele väljakutsele, kasutades mudeli abil saadud teavet sihtandmekogumist erineva valdkonna andmetest. Seda tehnikat on tavaliselt rakendatud kaheetapilise objekti tuvastamise töövoogu selgroovõrgustikus. Käesolevas töös uurime sisendandmestiku suuruse seost treenitavate kihtide osakaaluga selgroos. Eelkõige näitame mõned huvitavad leiud Faster R-CNN ResNet-50 FPN, tipptasemel objektide tuvastamise mudel ja MS COCO, võrdlusandmete kogum. Meie katsete tulemused näitavad, et kuigi mudel toimib üldiselt paremini, kui seda treenitakse rohkemate treeningandmetele peenhäälestatud kihtidega, väheneb selline eelis, kui sisendandmekogum muutub väiksemaks, kuna liiga paljude kihtide külmutamine võib põhjustada isegi tõsise ülesobitamise probleem. Õige arvu kihtide valimine külmutamiseks ülekandeõppe rakendamisel mitte ainult ei võimalda mudelil saavutada oma parimat võimalikku jõudlust, vaid säästab ka arvutusressursse ja treenimisaega. Lisaks uurime seost õppekiiruse lagunemise mõju ja sisendmestiku suuruse vahel. Arutleme ka eeliste üle, mida annab eelnevalt treenitud kaalude kasutamine võrreldes närvivõrgu nullist treenimisega.
Lõputöö keel
inglise
Lõputöö tüüp
Magister - Informaatika
Juhendaja(d)
Victor Henrique Cabral Pinheiro, Tomas Björklund
Kaitsmise aasta
2023
 
PDF