Häälte ja nende kirjelduste ühised vektoresitused

Nimi
Ivan Lastovko
Kokkuvõte
Vektoresitus on väga tõhus meetod, mida kasutatakse masinõppes, et esitada andmeid sisukamal ja tõhusamal viisil. Selles uuringus on meie eesmärk rakendada kõnelejate häälte ja vastavate tekstiliste kirjelduste vektoresitus, maksimeerides nende koosinussarnasust. Teisisõnu, me tahame ehitada süsteemi, mis suudab esitada nii hääli kui ka nende häälte kirjeldusi võimalikult täpselt mitmemõõtmelises ruumis. Meie töös hõlmab andmete kogumise protsess nii avalike andmekogumite kui ka käsitsi annoteeritud andmete kasutamist. Uurimistöö läbiviimiseks oleme kasutanud erinevaid treeningrežiime, näiteks eraldiseisvaid, kus kodeerijaid koolitatakse individuaalselt, ja ühiseid treeningtehnikaid, kus kodeerijaid koolitatakse koos, et õppida oma väljundeid vastavalt kohandama. Seejärel hindasime käsitsi kogutud andmekogumist eraldatud kontrollproovi mudeleid ja hindasime meie annotatsioonide kvaliteeti. Samuti oleme uurinud muutusi koosinuse sarnasuses kõlarite ja häälkirjelduste vektoresituse vahel kui annotatsiooni kvaliteet langeb.
Lõputöö keel
inglise
Lõputöö tüüp
Magister - Informaatika
Juhendaja(d)
Mark Fishel
Kaitsmise aasta
2023
 
PDF