E-kaubanduse toodete klassifitseerimine tekstiliste tootekirjelduste alusel

Nimi
Karmen Kink
Kokkuvõte
Harmoneeritud Süsteemi (HS) koodide määramine toodetele on vajalik tollinõuetele vastamiseks, statistika kogumiseks ja maksupettuste vältimiseks. Automaatne HS-koodide klassifitseerimine aitab aega säästa, sest HS on kompleksne ja paljude klassidega süsteem, mistõttu käsitsi õige klassi valimine on keerukas ja aeganõudev. Selles magistritöös kasutame HS-koodide klassifitseerimiseks kaht tüüpi masinõppemeetodeid: pindmistel tehisnärvivõrkudel põhinevaid klassifitseerijaid ja sügavatel tehisnärvivõrkudel, täpsemalt Transformer-arhitektuuril, põhinevaid klassifitseerijaid. Selgub, et sellise suurusega andmestiku puhul, nagu meil on võimalik kasutada, saab pindmisi klassifitseerijaid võrdlemisi kergesti arendada maani, kus nad annavad paremaid tulemusi kui sügavad närvivõrgud, viimaseid on aga oluliselt keerukam ja aeganõudvam edasi arendada. Lisaks leidsime, et kasutatav andmestik sisaldab valesti märgendatud kirjeid ning et sellel on negatiivne mõju mudelite kvaliteedile.
Lõputöö keel
inglise
Lõputöö tüüp
Magister - Informaatika
Juhendaja(d)
Kairit Sirts, Karl-Oskar Masing
Kaitsmise aasta
2021
 
PDF