機械学習周りのプログラミング中心。 イベント情報
ポケモンバトルAI本電子書籍通販中

ポケモンの見せ合い選出のナッシュ均衡 part05 選出アルゴリズムによるパーティの強さの変化【PokéAI】

前回、選出アルゴリズムに様々なパーティを操作させ、選出アルゴリズムの優劣を定量的に比較しました。 今回は逆に、パーティを軸にし、選出アルゴリズムによってその強さがどう変化するか観察します。

評価方法

選出アルゴリズムナッシュ均衡を用いて、パーティ P_iとパーティ P_jを対戦させた際のパーティ iの利得を S^{Nash}_{ij}とする。そして、パーティ iが他のすべてのパーティと対戦した際の平均利得を  \bar{S}^{Nash}_i = \frac{1}{K-1} \sum_{j \neq i} S^{Nash}_{ij} とする。すなわち、  \bar{S}^{Nash}_iが大きいパーティほど、選出アルゴリズムナッシュ均衡を用いた場合に強いパーティといえます。同様に選出アルゴリズムをランダムとした場合を  \bar{S}^{Random}_i と表記します。

そして、選出アルゴリズムを変化させたことによる利得変化  \bar{S}^{Nash}_i - \bar{S}^{Random}_i が最大、最小となるパーティを観察しました。

最も強くなったパーティ

以下のパーティAが、利得変化が最大となりました。

キングドラ,LV55,バブルこうせん,なみのり,たきのぼり,ずつき
スイクン,LV55,はかいこうせん,ずつき,たきのぼり,スピードスター
カビゴン,LV55,かいりき,れいとうビーム,ちきゅうなげ,じしん

相手パーティ jについて、 S^{Nash}_{ij} - S^{Random}_{ij} が最大となったものを示します。 S^{Nash}_{ij} = 0.88,  S^{Random}_{ij} = 0.34 でした。このケースでは、キングドラハッサムが選出され、キングドラが優勢という結果になります。

enemy party 47, advantage 0.54 (0.88 - 0.34)
ハッサム,LV55,とっしん,つばさでうつ,ずつき,おんがえし
カブトプス,LV55,なみのり,おんがえし,ギガドレイン,すなあらし
バンギラス,LV55,いあいぎり,かえんほうしゃ,だいもんじ,じしん
my nash strategy: [1. 0. 0.]
opponent nash strategy: [1. 0. 0.]
payoff:
[[ 0.88  0.96  1.  ]
 [-0.41 -0.58  0.24]
 [-0.07  0.84  0.22]]

別の相手パーティとの対戦では、カビゴンメガニウムが選出され、利得は-0.04となりほぼ互角です。ランダムに選出した場合の平均利得(-0.47)よりパーティAが有利になっています。

enemy party 45, advantage 0.43 (-0.04 - -0.47)
カイリュー,LV55,はかいこうせん,すてみタックル,かみなり,おんがえし
メガニウム,LV55,かげぶんしん,やどりぎのタネ,のしかかり,はかいこうせん
ニョロボン,LV55,ばくれつパンチ,のしかかり,かいりき,ちきゅうなげ
my nash strategy: [0. 0. 1.]
opponent nash strategy: [0. 1. 0.]
payoff:
[[-0.89 -0.86 -0.82]
 [-0.86 -0.52 -0.54]
 [ 0.25 -0.04  0.06]]

パーティAは水タイプ・ノーマルタイプの2系統の攻撃技が主に利用でき、相手によって異なるポケモンを出すことで相対的に強くなっています。しかしながら、スイクンキングドラの役割が重複してしまっている欠点があり、完ぺきとは言い難い構成です。

最も弱くなったパーティ

逆に以下のパーティBは、利得変化が最小(負の方向に大きい)となりました。

エアームド,LV55,どろかけ,おんがえし,ドリルくちばし,すなあらし
エアームド,LV55,いあいぎり,そらをとぶ,すなあらし,かげぶんしん
エンテイ,LV55,はかいこうせん,かいりき,ふみつけ,おんがえし

以下の相手に対し、最も利得が減少しました。ランダムに選出していれば互角に近い利得(-0.15)でしたが、ナッシュ均衡で選出するとエアームドバンギラスの対面になり、バンギラスの圧倒的優勢となります。

enemy party 20, advantage -0.83 (-0.98 - -0.15)
バンギラス,LV55,れいとうビーム,かえんほうしゃ,かいりき,おんがえし
カイリュー,LV55,すてみタックル,かげぶんしん,おんがえし,のしかかり
バリヤード,LV55,サイコキネシス,どくどく,10まんボルト,かみなり
my nash strategy: [1. 0. 0.]
opponent nash strategy: [1. 0. 0.]
payoff:
[[-0.98  0.84 -0.28]
 [-1.    0.74 -0.58]
 [-0.98  0.02  0.88]]

パーティBはノーマルタイプ・飛行タイプの技が中心で、ノーマル技が半減・無効にされる岩タイプやゴーストタイプに対してかなり弱くなっています。パーティAではノーマル技を半減する岩タイプに対して抜群となる水技が備わっているため、多少なりとも相性補完が効いていたといえるでしょう。

まとめ

前回、ナッシュ均衡に基づく選出を行うことがパーティの強さを引き出すことに対して有効であると確認しました。今回はナッシュ均衡に基づく選出のもとでは相性補完が効いているパーティがより強さを発揮することが確認できました。 しかしながら、相性補完が効いているパーティであっても3匹のうちの2匹の役割が重複していました。これは、ランダムに組んだパーティ100個を対象として検証を行ったことにより、十分によいパーティが含まれなかったことが原因と考えられます。次回以降はここまでの考察を元に、選出ステップを考慮した強いパーティの生成方法について検討していきます。