Klassifikaatorite hindamine kohaste skoorimisreeglitega
Nimi
Diana Grygorian
Kokkuvõte
Üks põhilisi ülesandeid masinõppes on klassifitseerimine, mis seisneb andmepunktile kategoorse väärtuse ennustamises teatud tunnuste alusel.
Klassifitseerija sooritusvõimet saab mõõta kaofunktsiooni abil, mis omistab igale klassitsifeerimisel tehtud veale mingi väärtuse.
Klassifitseerimisveaks nimetatakse olukorda, kus ennustatud kategoorne väärtus on erinev sellest, mis peaks olema tegelik väärtus. Kõige lihtsam on käsitleda kõikvõimalikke klassifitseerimisvigu võrdse kuluga. Siiski, mõndade probleemide lahendamine nõuab erinevat tüüpi klassifitseerimisvigadele erineva kaalu omistamist, ning see moodustab kaokonteksti. Olenevalt kaokontekstist on võimalik rakendada erinevaid kaofunktsioone. Näiteks, kui ühe valepositiivse ja ühe valenegatiivse hindade aritmeetiline keskmine on fikseeritud ning mõlemad on ühtlaselt jaotunud, sobib kaofunktsiooniks Brier’i skoor. Kui nende harmooniline keskmine on fikseeritud, sobib selle asemel kasutada logaritmilist kaofunktsiooni. Need kaks funktsiooni kuuluvad suuremasse kaofunktsioonide perekonda, mida tuntakse kohaste skoorimisreeglite nime all. Skoorimisreeglid on kaofunktsioonid mis tegelevad spetsiifiliselt tõenäosusliku klassifitseerimisega, kus klassifitseerijalt on oodatud iga kategooria tõenäosuse
ennustamist, kus tõenäosus omakorda näitab kindlust ennustatud kategoorias.
Antud magistritöös esitletakse uut kaokonteksti binaarsele klassifitseerimisele,
kus kummalgi klassil on sõltumatult ühtlane jaotus. Nimetatud kaokontekstile
pakutakse välja uus kaofunktsioon nimega Pöördskoor ning selle puhul tõestatakse, et see on kohane skoorimisreegel. Eksperimendid kinnitavad, et kogukulu vastavas kaokontekstis ning oodatud kadu kasutades uut kaofunktsiooni on samad.
Klassifitseerija sooritusvõimet saab mõõta kaofunktsiooni abil, mis omistab igale klassitsifeerimisel tehtud veale mingi väärtuse.
Klassifitseerimisveaks nimetatakse olukorda, kus ennustatud kategoorne väärtus on erinev sellest, mis peaks olema tegelik väärtus. Kõige lihtsam on käsitleda kõikvõimalikke klassifitseerimisvigu võrdse kuluga. Siiski, mõndade probleemide lahendamine nõuab erinevat tüüpi klassifitseerimisvigadele erineva kaalu omistamist, ning see moodustab kaokonteksti. Olenevalt kaokontekstist on võimalik rakendada erinevaid kaofunktsioone. Näiteks, kui ühe valepositiivse ja ühe valenegatiivse hindade aritmeetiline keskmine on fikseeritud ning mõlemad on ühtlaselt jaotunud, sobib kaofunktsiooniks Brier’i skoor. Kui nende harmooniline keskmine on fikseeritud, sobib selle asemel kasutada logaritmilist kaofunktsiooni. Need kaks funktsiooni kuuluvad suuremasse kaofunktsioonide perekonda, mida tuntakse kohaste skoorimisreeglite nime all. Skoorimisreeglid on kaofunktsioonid mis tegelevad spetsiifiliselt tõenäosusliku klassifitseerimisega, kus klassifitseerijalt on oodatud iga kategooria tõenäosuse
ennustamist, kus tõenäosus omakorda näitab kindlust ennustatud kategoorias.
Antud magistritöös esitletakse uut kaokonteksti binaarsele klassifitseerimisele,
kus kummalgi klassil on sõltumatult ühtlane jaotus. Nimetatud kaokontekstile
pakutakse välja uus kaofunktsioon nimega Pöördskoor ning selle puhul tõestatakse, et see on kohane skoorimisreegel. Eksperimendid kinnitavad, et kogukulu vastavas kaokontekstis ning oodatud kadu kasutades uut kaofunktsiooni on samad.
Lõputöö keel
inglise
Lõputöö tüüp
Magister - Informaatika
Juhendaja(d)
Meelis Kull, PhD
Kaitsmise aasta
2019