Märgendite andmepunktipõhine silumine klassifikaatorite paremaks kalibreerimiseks

Nimi
Mohamed Maher Abdelrahman
Kokkuvõte
Binaarne klassifikatsioon on üks masinõppe peamistest ülesannetest. See hõlmab endas tunnuste komplekti poolt määratud andmepunktide määramist ühte kahest klassist. Kuigi täpsed ennustused on enamikes ülesannetes olulised, on väga paljudel juhtudel oluline ka mudeli enesekindlus. Paljude tõenäosuslike klassifikatsioonide ennustused pole hästi kalibreeritud ja kipuvad olema liigse enesekindlusega, seetõttu vajades täiendavat kalibreerimist mudeli treenimise järeltöötluses.
Logistiline kalibreerimine on üks populaarsematest kalibreerimismeetoditest. See sobitab logistilise regressiooni mudeli klassifikatsiooni mudeli väljunditele, et saada kalibreeritud tõenäosusjaotus üle kõigi klasside. Treeningandmetele ülesobitamise vähendamiseks saab logistilise regressioonimudeli sobitamisel rakendada mitmeid regulariseerimismeetodeid. Platti skaleerimine on üks neist meetoditest ning kasutab märgendite silumist klasside märgenditel ja muudab nad sihttõenäosusteks enne logistilise regressioonimudeli rakendamist, seekaudu langetades mudeli liigset enesekindlust. Lisaks sellele kasutatakse märgendite silumist ka klassifikatsiooni teostavates närvivõrkudes. Eelnev teadustöö on näidanud, et märgendite silumisel on positiivsete efektidega mudelite kalibreeritusele ja üldistusvõimele. Samas kustutab see informatsiooni klasside sarnasusstruktuuridest, koheldes kõiki valesid klasse võrdtõenäolisena, seekaudu kahjustades treenitud võrgu destilleerimisvõimekust.
Antud magistritöös on eesmärk leida paremaid meetodeid logistilise regressiooni liigse enesekindluse vähendamiseks. Selle jaoks on tuletatud uus Bayesi lähenemisel baseeruv valem optimaalsete tõenäosusprognooside leidmiseks, eeldusel et generatiivse mudeli jaotus on teada. Selle valemi rakendamiseks praktikas on leitud ka lähendusmeetod. Lisaks sellele on välja pakutud uus märgendite andmepunktipõhine silumise meetod logistilise regressiooni sobitamiseks. Sellest meetodist motiveerituna on esitatud ka uudne lähenemine närvivõrkude märgendite silumisele, mis täiendas destilleerimis- ja kalibreerimisvõimekust võrreldes tavalise märgendite silumisega.

Meetodite hindamiseks teostatud eksperimendid kinnitasid, et töös tuletatud optimaalsete ennustuste lähendusvalem edestab tulemustelt kõiki teisi regulariseerimismeetodeid autorite poolt sünteesitud andmestikes, kus on generatiivse mudeli jaotus teada. Seevastu realistlikumatel juhtudel, kus see jaotus pole teada, näitab uus märgendite andmepunktipõhine silumine paremat jõudlust võrreldes Platti skaleerimisega enamikes nii tegelikes kui sünteesitud andmestikes nii logaritmilise kaofunktsiooni kui ka kalibreerimisvea poolest. Lisaks, märgendite andmepunktipõhine silumine edestas närvivõrkude treenimisel traditsioonilist märgendite silumist nii logaritmilise kahju, kalibreerimisvea kui ka võrgu destilleerimise poolest.
Lõputöö keel
inglise
Lõputöö tüüp
Magister - Informaatika
Juhendaja(d)
Meelis Kull
Kaitsmise aasta
2020
 
PDF