arvutiteaduse instituudi lõputööderegister


Radial softmax: uus närvivõrkude aktivatsiooni funktsioon, et vähendada liigset kindlust jaotuseväliste andmestike puhul
Nimi Rain Vagel
Kokkuvõte Tehisnärvivõrke kasutatakse laialdaselt heade tulemustega aladel nagu masintõlge, piltide klassifitseerimine ja häältuvastus. Nende võrkude eelduseks on, et kasutusandmed on treeningandmetega samast jaotusest. Vastasel juhul väljastab mudel kõrge kindlusega valesid tulemusi. Selles töös tutvustame me, kuidas softmax selles olukorras käitub ning selle probleemidest. Me tutvustame uut aktivatsiooni funktsiooni nimega radial softmax, mis on paremini võimeline ära tundma jaotuseväliseid andmeid. Me esitame tulemusi, mis näitavad, et meie funktsioon annab osade jaotuseväliste andmete puhul softmax'ist paremaid tulemusi. Vastavalt kirjanduse ülevaatele oleme me esimesed, kes pakuvad välja softmax'ile alternatiivset funktsiooni selle probleemi lahendamiseks. Meie funktsiooniga ei ole vaja teha muudatusi mudelite treenimisel ega teha liigseid muudatusi nende arhitektuurides. Neid mudeleid, mille puhul me teame, et need ei väljasta kõrge kindlusega valesid väljundeid, saame kasutada alades, kus vead pole aksepteeritavad. Nendeks on näiteks meditsiin, riigikaitse ja autonoomne juhtimine.
Lõputöö keel inglise
Lõputöö tüüp Magister - Informaatika
Juhendaja(d) Ardi Tampuu, Meelis Kull, Raul Vicente
Kaitsmise aasta 2020
PDF