Automatiseeritud makse klassifikaator jaepanganduses
Nimi
Artem Mateush
Kokkuvõte
Selleks, et saavutada oma ärilisi eesmärke ja parendada teenusepakkumist, kasutavad jaepangad spetsiaalseid tehnikaid oma klientide andmete analüüsimisel.
\t\tKaasaaegseid masinõppe tehnikaid saab selles valdkonnas kasutada täiendusena klassikalistele andmeanalüüsi meetoditele. Oskus oma klientide makseid klassifitseerida võimaldab jaepankadel oma klientide kulutuste mustritest paremini aru saada ja oma pakkumisi spetsiaalselt kohandada.
\t\tMaksete klassifitseerimine on raske probleem, kuna äriklientide hulk on suur ja muutuv ja kuna iga äriklient võib pakkuda mitut tüüpi tooteid, näiteks võib müüa nii toitu kui elektroonikat. Kaks maksete klassifitseerimise põhilist lähenemist on reeglitepõhine ja masinõppe põhine klassifitseerimine.
\t\tMasinõppepõhine klassifitseerimismeetod on supervised õppe vorm, ja sellisena vajab ta märgendatud andmeühikute kogumit - meie puhul klientide endi poolt klassifitseeritud transaktsioone (mis on oma olemuselt crowdsourcing).
\t\tReeglitepõhine lähenemine ei ole skaleeruv, sest see vajab iga äri ja transaktsioonitüübi jaoks hallatavat reeglite kogumit. Crowdsourcing põhine lähenemine toob endaga kaasa vasturääkivused ja seda on alguses raske käivitada, kuna vajatakse suure hulga klientide poolt, pika ajaperioodi jooksul, manuaalselt märgendatud transaktsioonide kogumit.
\t\tSiinkohal toome ära finantsasutuse kaasusuuringu, mille raames on kasutatud hübriidlähenemist. Kasutusel on finantsplaneerimise tööriist, mille käivitamiseks on loodud esmane reeglite kogum, ja klientidele on selle raames loodud võimalus vaadelda oma transaktsioone klassifitseerituna 66 kategooriasse ning lisada märgendeid klassifitseerimata transaktsioonidele või uuesti märgendada juba märgendatud transaktsioone. Crowdsource märgendeid ja algset reeglite kogumit kasutatakse seejärel masinõppe mudeli treenimisel.
\t\tMe hindame oma mudeli tõhusust elust võetud anonümiseeritud andmestikku kasutades, mille oleme saanud pangalt. See koosneb kontomaksetest ja kaardimaksetest. Täpsustades võib öelda, et kontomaksete andmestikul parandas hübriidlähenemine reeglitepõhise süsteemiga võrreldes katvust 76.4\\%-lt 87.4\\%-le, mille juures crowdsource abiga leitud märgendeid replitseeriti 0.92 keskmise AUC juures, ja seda olenemata crowdsource märgendites leiduvatest vasturääkivustest.
\t\tSelline süsteemi edasiarendus viitab väljapakutud hübriidmudeli põhjendatusele, ning positiivne hinnang tulemustele võimaldab meid seadistada ja integreerida hübriidmudelit panga süsteemidega.
\t\tKaasaaegseid masinõppe tehnikaid saab selles valdkonnas kasutada täiendusena klassikalistele andmeanalüüsi meetoditele. Oskus oma klientide makseid klassifitseerida võimaldab jaepankadel oma klientide kulutuste mustritest paremini aru saada ja oma pakkumisi spetsiaalselt kohandada.
\t\tMaksete klassifitseerimine on raske probleem, kuna äriklientide hulk on suur ja muutuv ja kuna iga äriklient võib pakkuda mitut tüüpi tooteid, näiteks võib müüa nii toitu kui elektroonikat. Kaks maksete klassifitseerimise põhilist lähenemist on reeglitepõhine ja masinõppe põhine klassifitseerimine.
\t\tMasinõppepõhine klassifitseerimismeetod on supervised õppe vorm, ja sellisena vajab ta märgendatud andmeühikute kogumit - meie puhul klientide endi poolt klassifitseeritud transaktsioone (mis on oma olemuselt crowdsourcing).
\t\tReeglitepõhine lähenemine ei ole skaleeruv, sest see vajab iga äri ja transaktsioonitüübi jaoks hallatavat reeglite kogumit. Crowdsourcing põhine lähenemine toob endaga kaasa vasturääkivused ja seda on alguses raske käivitada, kuna vajatakse suure hulga klientide poolt, pika ajaperioodi jooksul, manuaalselt märgendatud transaktsioonide kogumit.
\t\tSiinkohal toome ära finantsasutuse kaasusuuringu, mille raames on kasutatud hübriidlähenemist. Kasutusel on finantsplaneerimise tööriist, mille käivitamiseks on loodud esmane reeglite kogum, ja klientidele on selle raames loodud võimalus vaadelda oma transaktsioone klassifitseerituna 66 kategooriasse ning lisada märgendeid klassifitseerimata transaktsioonidele või uuesti märgendada juba märgendatud transaktsioone. Crowdsource märgendeid ja algset reeglite kogumit kasutatakse seejärel masinõppe mudeli treenimisel.
\t\tMe hindame oma mudeli tõhusust elust võetud anonümiseeritud andmestikku kasutades, mille oleme saanud pangalt. See koosneb kontomaksetest ja kaardimaksetest. Täpsustades võib öelda, et kontomaksete andmestikul parandas hübriidlähenemine reeglitepõhise süsteemiga võrreldes katvust 76.4\\%-lt 87.4\\%-le, mille juures crowdsource abiga leitud märgendeid replitseeriti 0.92 keskmise AUC juures, ja seda olenemata crowdsource märgendites leiduvatest vasturääkivustest.
\t\tSelline süsteemi edasiarendus viitab väljapakutud hübriidmudeli põhjendatusele, ning positiivne hinnang tulemustele võimaldab meid seadistada ja integreerida hübriidmudelit panga süsteemidega.
Lõputöö keel
inglise
Lõputöö tüüp
Magister - Tarkvaratehnika
Juhendaja(d)
Rajesh Sharma
Kaitsmise aasta
2018