Andmepunktide panuse visualiseerimine binaarklassifitseerija kaos

Nimi
Magnus Paal
Kokkuvõte
Masinõppe klassifikaatorite hindamiseks kasutatud kaofunktsioonide väljundi kahanemine on üks viis kuidas hinnata klassifikaatori paranemist. Kaofunktsiooni väljundi ehk kao korral on tegemist ainult ühe arvulise väärtusega ja see ei anna alati head ülevaadet nii klassifikaatorist kui ka andmetest. Töö eesmärk oli uurida, kuidas oleks kadu võimalik tõlgendada andmepunktide kaudu ja leida viis selle visualiseerimiseks. Visualisatsioonid, mis töö käigus leiti ja tutvustati võimaldavad eelkõige uurida, kuidas iga eraldi seisev andmepunkt tervesse kaosse panustab. Selle abil saab uurida milliste andmepunktide panus kaosse on üldiselt suurem, kas nende, mida on rohkem ja millele ennustatud väärtus on lähemal tegelikule väärtusele või nende, mida on vähem ja mille ennustatud väärtus on kaugemal tegelikust väärtusest. Teiseks saab võrrelda klassifikaatoreid ja võrrelda kadude erinevuse korral, millised on andmepunktid, mis on sellesse erinevusse peamised panustajad. Kolmandaks sai eri andmepunkte visualiseeringus eraldada tunnuste põhjal ja uurida, millised neist tunnustest panustavad kaosse kõige rohkem.
Lõputöö keel
eesti
Lõputöö tüüp
Bakalaureus - Informaatika
Juhendaja(d)
Meelis Kull
Kaitsmise aasta
2021
 
PDF