Mély megerősítéses tanulás alapú Hive játékos
Jelen dolgozat egy napjainkban egyre hangsúlyosabb témát, a mesterséges intelligencia alapú társasjáték ágenseknek a témakörét taglalja,
egy olyan konkrét stratégiai táblajátékkal kapcsolatban, amire napjainkban még nem léteznek effektív algoritmusok.
A dolgozat célja a Hive elnevezésű stratégiai táblajáték játszására képes mester-
séges intelligencia ágens megtervezése és implementálása.
A Hive egy kétszemélyes táblajáték, melyben a játékosok különböző köveket helyezhetnek le és mozgathatnak a
játék szabályainak megfelelően. A játék célja körülkeríteni az ellenfél játékosának méhkirá-
lynőjét. Az intelligens ágens tervezése szempontjából a feladat különleges - a sakk és go játékoktól eltérő - kihívása, hogy a játékhoz
nem tartozik tábla, a kövek önmagukban alkotják a játékteret.
A projekt célja egy olyan mély megerősítéses tanulás alapú algoritmus létrehozása,
mely megközelíti a Hive játékosok teljesítményét. Ennek a célnak az elérése végett szük-
ség van egy olyan szoftveres környezet létrehozására, melyben a tanuló eljárást futtatni és
tesztelni lehet.
A feladat célkitűzését a DeepMind nevű brit cég AplhaGo Zero nevű szoftvere ihlette, mely egy intelligens ágens a
Go társasjátékhoz. Az ágens játékokat futtatva önmaga ellen felparaméterez egy mély neurális hálót, mely segítségével
az ágens a döntéseit hozza.
A dolgozat végigkíséri az olvasót a szoftver tervezésének és implementációjának
menetén, illetve összegzést nyújt a feladat elméleti hátteréről.
szerző
-
Bunth Tamás
Mérnök informatikus szak, mesterképzés
mesterképzés (MA/MSc)
konzulens
-
Dr. Gyires-Tóth Bálint
adjunktus, Távközlési és Mesterséges Intelligencia Tanszék