arvutiteaduse instituudi lõputööderegister


Tüübituletus neljandat järku loogikavalemitele
Nimi Behrad Moeini
Kokkuvõte Arendajad kasutavad tarkvara arendusprotsessi luues probleemide raporteerimist, mis võivad kirjeldada koodi vigu, soovitud uut funktsionaalsust või muudatusettepanekuid. Projekti kasvades aja jooksul raporteeritud probleemide hulk kasvab ja mõnda probleemi esitatakse erinevate kasutajate poolt mitu korda. Selle vältimiseks on välja pakutud mitmeid automatiseeritud lähenemisi korduvate probleemi raportite leidmiseks. Peamiselt on need lähenemised baseerunud informatsiooni leidmise tehnikatel.
Käesolev uurimistöö keskendub semantiliselt samaväärse teksti tuvastamisele ja valdkonna viimastele edusammudele korduvate probleemi raportite leidmiseks. Antud teemal on publitseeritud mitmeid artikleid ja selle uurimistöö peamine väljakutse on olemasolevaid lähenemisi jäljendada ja võrrelda tulemusi töös välja pakutud uue lahendusega. Osa tööst on seotud probleemihalduse andmetest vajaliku info leidmise ja eraldamisega. Käesoleva uurimustöö raames välja arendatud lahendus läheneb küsimuste paari samaväärseks või mitte klassifitseerimisele kui loomuliku keele töötluse probleemile. Uurimistöös kasutatakse Github’ist võetud avaandmeid, mida on kasutatud mitmetes projektides, mis muudab tulemuste võrdlemise teiste töödega lihtsamaks.
Küsimuste paari semantilise võrdsuse üle otsustamiseks kasutati erinevaid mudeleid - alustati lihtsamatest ja samm-sammult jõuti keerukamate mudeliteni. Iga mudelit rakendati samadele andmetele ja kõiki nende tulemusi võrreldi omavahel.
Lõputöö keel inglise
Lõputöö tüüp Magister - Informaatika
Juhendaja(d) Dr. Ezequiel Scott
Kaitsmise aasta 2021
PDF