Radial softmax: uus närvivõrkude aktivatsiooni funktsioon, et vähendada liigset kindlust jaotuseväliste andmestike puhul

Nimi
Rain Vagel
Kokkuvõte
Tehisnärvivõrke kasutatakse laialdaselt heade tulemustega aladel nagu masintõlge, piltide klassifitseerimine ja häältuvastus. Nende võrkude eelduseks on, et kasutusandmed on treeningandmetega samast jaotusest. Vastasel juhul väljastab mudel kõrge kindlusega valesid tulemusi. Selles töös tutvustame me, kuidas softmax selles olukorras käitub ning selle probleemidest. Me tutvustame uut aktivatsiooni funktsiooni nimega radial softmax, mis on paremini võimeline ära tundma jaotuseväliseid andmeid. Me esitame tulemusi, mis näitavad, et meie funktsioon annab osade jaotuseväliste andmete puhul softmax'ist paremaid tulemusi. Vastavalt kirjanduse ülevaatele oleme me esimesed, kes pakuvad välja softmax'ile alternatiivset funktsiooni selle probleemi lahendamiseks. Meie funktsiooniga ei ole vaja teha muudatusi mudelite treenimisel ega teha liigseid muudatusi nende arhitektuurides. Neid mudeleid, mille puhul me teame, et need ei väljasta kõrge kindlusega valesid väljundeid, saame kasutada alades, kus vead pole aksepteeritavad. Nendeks on näiteks meditsiin, riigikaitse ja autonoomne juhtimine.
Lõputöö keel
inglise
Lõputöö tüüp
Magister - Informaatika
Juhendaja(d)
Ardi Tampuu, Meelis Kull, Raul Vicente
Kaitsmise aasta
2020
 
PDF