Arvutiteaduse instituut - lõputööde register

Valminud lõputööd (sisestamine) Lõputööde teemad (sisestamine)

Stiimulõpe iseseisvas navigeerimises: juhtumiuuring struktureeritud keskkonnas

Nimi

Anne Ott

Kokkuvõte

Viimastel aastatel on isejuhtivate sõidukite valdkonnas toimunud suur edasiminek. Kiirendamaks arengut kõrgelt automatiseeritud sõidukite vallas on suurt rolli mänginud masinõppe edusammudel põhinevad lahedused. Märkimisväärne progress keerukate probleemide lahendamisel on toimunud tänu stiimulõppe-nimelisele masinõppe harule. Stiimulõppe põhimõte on see, et keskkonda on paigutatud agent, kelle eesmärk on ümbritsevas keskkonnas tegutseda maksimeerides tegevustest tulenevat preemiat ja täites etteantud ülesandeid. Sellest on saanud võimas tööriist, mis suudab õppida keerukaid käitumismustreid kõrgemõõtmelistes keskkondades. Üks olulistest stiimulõppe aspektidest isejuhtivate sõidukite vallas on ohutus, sest vigadel on eluohtlikud tagajärjed.
Magistritöö eesmärk on pakkuda välja standardiseeritud keskkond ja täiendatud stiimulõppe arhitektuur, kus agendid saaksid õppida struktureeritud maailmas. Agentide treenimiseks kasutatakse algoritme, mis põhinevad Usalduspiirkonna käitumispoliitika optimeerimise algoritmil ja Lähima käitumispoliitika optimeerimise algoritmil. Tulemusi mõõdetakse nii selle järgi, kui edukalt agent täidab etteantud ülesannet, kui ka selle järgi, kui ohutult agent käitub. Lisaks võrreldakse välja pakutud mudeleid lähtemudelitega.

Lõputöö keel

inglise

Lõputöö tüüp

Magister - Informaatika

Juhendaja(d)

Amnir Hadachi, Shan Wu

Kaitsmise aasta

2021

PDF

TÜ arvutiteaduse instituudi lõputööde register

Stiimulõpe iseseisvas navigeerimises: juhtumiuuring struktureeritud keskkonnas