Minecrafti võistlusmängude õppimine stiimulõppega

Nimi
Laur Sisask
Kokkuvõte
Viimaste aastate jooksul on stiimulõppe meetodeid edukalt kasutatud, et luua tehisintellekt mängimaks keerulisi mänge nagu Go, StarCraft II ja Dota 2. Selles töös rakendatakse stiimulõppe meetodeid, et treenida Minecraftile tehismängijad. Ühest populaarsemast Minecrafti serverist Hypixel valitakse välja erinevad üks-ühele minimängud, millele kõigile treenitakse tehismängijad. Treenimiseks kasutatakse piiritletud käitumisviisi optimeerimise (inglise keeles proximal policy optimization) algoritmi ja iseenda vastu mängimist (inglise keeles self-play). Kõik treenitud mängijad olid võimelised mängima valitud minimänge vähemalt algaja tasemel. Ühes mängus jõudis tehismängija ekspertmängijate tasemele.
Lõputöö keel
inglise
Lõputöö tüüp
Bakalaureus - Informaatika
Juhendaja(d)
Tambet Matiisen
Kaitsmise aasta
2022
 
PDF