arvutiteaduse instituudi lõputööderegister


Stiimulõpe iseseisvas navigeerimises: juhtumiuuring struktureeritud keskkonnas
Nimi Anne Ott
Kokkuvõte Viimastel aastatel on isejuhtivate sõidukite valdkonnas toimunud suur edasiminek. Kiirendamaks arengut kõrgelt automatiseeritud sõidukite vallas on suurt rolli mänginud masinõppe edusammudel põhinevad lahedused. Märkimisväärne progress keerukate probleemide lahendamisel on toimunud tänu stiimulõppe-nimelisele masinõppe harule. Stiimulõppe põhimõte on see, et keskkonda on paigutatud agent, kelle eesmärk on ümbritsevas keskkonnas tegutseda maksimeerides tegevustest tulenevat preemiat ja täites etteantud ülesandeid. Sellest on saanud võimas tööriist, mis suudab õppida keerukaid käitumismustreid kõrgemõõtmelistes keskkondades. Üks olulistest stiimulõppe aspektidest isejuhtivate sõidukite vallas on ohutus, sest vigadel on eluohtlikud tagajärjed.
Magistritöö eesmärk on pakkuda välja standardiseeritud keskkond ja täiendatud stiimulõppe arhitektuur, kus agendid saaksid õppida struktureeritud maailmas. Agentide treenimiseks kasutatakse algoritme, mis põhinevad Usalduspiirkonna käitumispoliitika optimeerimise algoritmil ja Lähima käitumispoliitika optimeerimise algoritmil. Tulemusi mõõdetakse nii selle järgi, kui edukalt agent täidab etteantud ülesannet, kui ka selle järgi, kui ohutult agent käitub. Lisaks võrreldakse välja pakutud mudeleid lähtemudelitega.
Lõputöö keel inglise
Lõputöö tüüp Magister - Informaatika
Juhendaja(d) Amnir Hadachi, Shan Wu
Kaitsmise aasta 2021
PDF