汎用行動選択モデルの学習 part03 パーティ固有行動選択モデルを用いた学習データの生成【PokéAI】

任意のパーティを受け取って、バトル中の行動（技）を選択する「汎用行動選択モデル」を学習していきます。この記事では、モデルの構造を検討するための疑似教師データの作成を考えます。汎用行動選択モデルではDeep Neural Networkを用いることを考えてい…

汎用行動選択モデルの学習 part02 ポケモン・技のサブセット作成【PokéAI】

任意のパーティを受け取って、バトル中の行動（技）を選択する「汎用行動選択モデル」を学習していきます。この記事では、学習を容易にするためポケモン・技の数を制限する手法を考えます。バトルのルールの前提条件は、ポケモン金銀ルールパーティのポ…

今までポケモンバトル中の行動選択を行うモデルは、パーティごとに別個のパラメータを学習していました。しかし今後の発展を考えるとこの方式は難点があり、あらゆるパーティの行動選択を行える単一のモデルを学習したいと思いました。昨年8月を最後にイベ…