Tüübituletus neljandat järku loogikavalemitele
Nimi
Behrad Moeini
Kokkuvõte
Arendajad kasutavad tarkvara arendusprotsessi luues probleemide raporteerimist, mis võivad kirjeldada koodi vigu, soovitud uut funktsionaalsust või muudatusettepanekuid. Projekti kasvades aja jooksul raporteeritud probleemide hulk kasvab ja mõnda probleemi esitatakse erinevate kasutajate poolt mitu korda. Selle vältimiseks on välja pakutud mitmeid automatiseeritud lähenemisi korduvate probleemi raportite leidmiseks. Peamiselt on need lähenemised baseerunud informatsiooni leidmise tehnikatel.
Käesolev uurimistöö keskendub semantiliselt samaväärse teksti tuvastamisele ja valdkonna viimastele edusammudele korduvate probleemi raportite leidmiseks. Antud teemal on publitseeritud mitmeid artikleid ja selle uurimistöö peamine väljakutse on olemasolevaid lähenemisi jäljendada ja võrrelda tulemusi töös välja pakutud uue lahendusega. Osa tööst on seotud probleemihalduse andmetest vajaliku info leidmise ja eraldamisega. Käesoleva uurimustöö raames välja arendatud lahendus läheneb küsimuste paari samaväärseks või mitte klassifitseerimisele kui loomuliku keele töötluse probleemile. Uurimistöös kasutatakse Github’ist võetud avaandmeid, mida on kasutatud mitmetes projektides, mis muudab tulemuste võrdlemise teiste töödega lihtsamaks.
Küsimuste paari semantilise võrdsuse üle otsustamiseks kasutati erinevaid mudeleid - alustati lihtsamatest ja samm-sammult jõuti keerukamate mudeliteni. Iga mudelit rakendati samadele andmetele ja kõiki nende tulemusi võrreldi omavahel.
Käesolev uurimistöö keskendub semantiliselt samaväärse teksti tuvastamisele ja valdkonna viimastele edusammudele korduvate probleemi raportite leidmiseks. Antud teemal on publitseeritud mitmeid artikleid ja selle uurimistöö peamine väljakutse on olemasolevaid lähenemisi jäljendada ja võrrelda tulemusi töös välja pakutud uue lahendusega. Osa tööst on seotud probleemihalduse andmetest vajaliku info leidmise ja eraldamisega. Käesoleva uurimustöö raames välja arendatud lahendus läheneb küsimuste paari samaväärseks või mitte klassifitseerimisele kui loomuliku keele töötluse probleemile. Uurimistöös kasutatakse Github’ist võetud avaandmeid, mida on kasutatud mitmetes projektides, mis muudab tulemuste võrdlemise teiste töödega lihtsamaks.
Küsimuste paari semantilise võrdsuse üle otsustamiseks kasutati erinevaid mudeleid - alustati lihtsamatest ja samm-sammult jõuti keerukamate mudeliteni. Iga mudelit rakendati samadele andmetele ja kõiki nende tulemusi võrreldi omavahel.
Lõputöö keel
inglise
Lõputöö tüüp
Magister - Informaatika
Juhendaja(d)
Dr. Ezequiel Scott
Kaitsmise aasta
2021