2020-02-01から1ヶ月間の記事一覧
任意のパーティを受け取って、バトル中の行動(技)を選択する「汎用行動選択モデル」を学習していきます。 この記事では、モデルの構造を検討するための疑似教師データの作成を考えます。 汎用行動選択モデルではDeep Neural Networkを用いることを考えてい…
任意のパーティを受け取って、バトル中の行動(技)を選択する「汎用行動選択モデル」を学習していきます。 この記事では、学習を容易にするためポケモン・技の数を制限する手法を考えます。 バトルのルールの前提条件は、 ポケモン金銀ルール パーティのポ…
今までポケモンバトル中の行動選択を行うモデルは、パーティごとに別個のパラメータを学習していました。しかし今後の発展を考えるとこの方式は難点があり、あらゆるパーティの行動選択を行える単一のモデルを学習したいと思いました。 昨年8月を最後にイベ…