E-äri klientide klassifitseerimine rakenduse logide põhjal
Nimi
Aleksei Panarin
Kokkuvõte
Fits.me ettevõte on arendanud veebipõhise rakenduse, mis aitab veebipoodide külastajatel valida õiget suurust riideid. Virtuaalse Proovikabiini rakendus logib kasutajate tegevusi ja salvestab sisestatud kehamõõdud andmebaasi. Lisaks kasutatakse Google Analytics andmeid, mis annab andmeid veebipoe külastuste sessioonidest ja sellistest kasutajate omadustest, nagu asukoht, kasutatud tarkvara ja riistvara. Käesoleva lõputöö põhiline ülesanne on analüüsida andmed ja õppida eraldama logidest kasulikku informatsiooni. Täpsemalt, me tahame leida meetodi veebipoe kasutajate grupeerimiseks.
Esimesel etapil me leiame viisi erinevatest allikatest andmete kokkupanemiseks. Me agregeerime andmeid kasutajate- ja sessioonipõhisteks profiilideks. Andmed on puhastatud. Nende vorm on informatiivsem, ning andmed on valmis edaspidiseks analüüsiks. Andmete puhastamine ja eeltöötlus moodustavad lõputöös tähtsa osa.
Analüüsietapil me kasutame kahte andmete klassifitseerimismeetodit. Need on Otsustuspuud ja Naive Bayes. Me otsustame grupeerida kasutajaid e-kaubanduse jaoks ühe tähtsa tunnuse järgi: me klassifitseerime kasutajaid selle järgi, kas nad on teinud ostu või mitte, kas nad on tagastanud ostetud toodet või mitte. Klassifitseerimispuu ega Naive Bayes ei tuvastanud olulisi seoseid uuritud atribuutide ja ostukäitumise vahel. Kuid regressioonipuu osutus kasulikuks sarnase käitumisega kasutajate gruppide leidmises. See näitab, millise käitumismustri korral on ostu tegemise tõenäosus suurem ning millise käitumise korral väiksem.
Esimesel etapil me leiame viisi erinevatest allikatest andmete kokkupanemiseks. Me agregeerime andmeid kasutajate- ja sessioonipõhisteks profiilideks. Andmed on puhastatud. Nende vorm on informatiivsem, ning andmed on valmis edaspidiseks analüüsiks. Andmete puhastamine ja eeltöötlus moodustavad lõputöös tähtsa osa.
Analüüsietapil me kasutame kahte andmete klassifitseerimismeetodit. Need on Otsustuspuud ja Naive Bayes. Me otsustame grupeerida kasutajaid e-kaubanduse jaoks ühe tähtsa tunnuse järgi: me klassifitseerime kasutajaid selle järgi, kas nad on teinud ostu või mitte, kas nad on tagastanud ostetud toodet või mitte. Klassifitseerimispuu ega Naive Bayes ei tuvastanud olulisi seoseid uuritud atribuutide ja ostukäitumise vahel. Kuid regressioonipuu osutus kasulikuks sarnase käitumisega kasutajate gruppide leidmises. See näitab, millise käitumismustri korral on ostu tegemise tõenäosus suurem ning millise käitumise korral väiksem.
Lõputöö keel
inglise
Lõputöö tüüp
Magister - Tarkvaratehnika
Juhendaja(d)
Rauno Viin, Siim Karus
Kaitsmise aasta
2015