arvutiteaduse instituudi lõputööderegister


Minecrafti võistlusmängude õppimine stiimulõppega
Nimi Laur Sisask
Kokkuvõte Viimaste aastate jooksul on stiimulõppe meetodeid edukalt kasutatud, et luua tehisintellekt mängimaks keerulisi mänge nagu Go, StarCraft II ja Dota 2. Selles töös rakendatakse stiimulõppe meetodeid, et treenida Minecraftile tehismängijad. Ühest populaarsemast Minecrafti serverist Hypixel valitakse välja erinevad üks-ühele minimängud, millele kõigile treenitakse tehismängijad. Treenimiseks kasutatakse piiritletud käitumisviisi optimeerimise (inglise keeles proximal policy optimization) algoritmi ja iseenda vastu mängimist (inglise keeles self-play). Kõik treenitud mängijad olid võimelised mängima valitud minimänge vähemalt algaja tasemel. Ühes mängus jõudis tehismängija ekspertmängijate tasemele.
Lõputöö keel inglise
Lõputöö tüüp Bakalaureus - Informaatika
Juhendaja(d) Tambet Matiisen
Kaitsmise aasta 2022
PDF