arvutiteaduse instituudi lõputööderegister


E-kaubanduse toodete klassifitseerimine tekstiliste tootekirjelduste alusel
Nimi Karmen Kink
Kokkuvõte Harmoneeritud Süsteemi (HS) koodide määramine toodetele on vajalik tollinõuetele vastamiseks, statistika kogumiseks ja maksupettuste vältimiseks. Automaatne HS-koodide klassifitseerimine aitab aega säästa, sest HS on kompleksne ja paljude klassidega süsteem, mistõttu käsitsi õige klassi valimine on keerukas ja aeganõudev. Selles magistritöös kasutame HS-koodide klassifitseerimiseks kaht tüüpi masinõppemeetodeid: pindmistel tehisnärvivõrkudel põhinevaid klassifitseerijaid ja sügavatel tehisnärvivõrkudel, täpsemalt Transformer-arhitektuuril, põhinevaid klassifitseerijaid. Selgub, et sellise suurusega andmestiku puhul, nagu meil on võimalik kasutada, saab pindmisi klassifitseerijaid võrdlemisi kergesti arendada maani, kus nad annavad paremaid tulemusi kui sügavad närvivõrgud, viimaseid on aga oluliselt keerukam ja aeganõudvam edasi arendada. Lisaks leidsime, et kasutatav andmestik sisaldab valesti märgendatud kirjeid ning et sellel on negatiivne mõju mudelite kvaliteedile.
Lõputöö keel inglise
Lõputöö tüüp Magister - Informaatika
Juhendaja(d) Kairit Sirts, Karl-Oskar Masing
Kaitsmise aasta 2021
PDF