以前、山田@CSAさんに教えていただいた、イメージと読みの将棋観を買いました。プロ棋士が局面に勝率をつけているのが興味深いです。この本の内容が分かるくらいの棋力があると楽しそうなのですが、残念ながら私はとても弱いです。でも、GPS将棋の読みと比べることは面白いかもしれません。
本題ですが、評価値を勝率に結びつける手法として、竹内提案のevaluation curveというグラフ化があります。
横軸が評価値(歩100点換算)で縦軸が勝率です。グラフの読み方は、棋譜の中から、1000点くらいの評価値がついた局面を集めて、元の棋譜での勝敗を調べたら勝率7割くらいだった、と読みます。今回は将棋クラブ24の24万局の書籍の棋譜とGPS将棋r2110を使いました。赤いグラフが評価値そのものを使った場合で、緑のグラフは静止探索(末端4手相当)の評価値を使った場合です。まず、グラフが右肩上がりなので、評価値が悪いと負け試合が多く評価値が良いと勝ちが多いと、評価値と人間の勝ち負けが対応していることが分かります。また、赤と緑を比べると、わずかながら緑の方が傾きが急になっています。つまり、緑の方が評価値に信頼性があります。例えば評価値-2000点くらいのところでも赤は2割くらい勝つ可能性がありますが、緑は1割くらいしかありません。これが探索の効果と言えそうです。gpsshogi@twitterは16-18手くらい読んでいるので、もしその条件でグラフを描けば、もっと傾きが急になるはずです。開発者の予想では、深く読んで1000点を越えたら、頓死以外ではほとんど負けない気がします。しかし、このグラフを描くには、2400万局面くらい評価しているので、深く読んだグラフを描くのは難しい状況です。
上のグラフは、どちらかのレートが1500以上の対局だけ対象にしています。これをすべての対局を対象にするように変更すると、下のグラフの青になります。緑と青を比べると、傾きが緩くなっています。これは、レート1500未満同士の人の棋譜を混ぜると、GPS将棋が人間の勝敗を予想しにくくなるということを意味します。つまりグラフから読み取れる信頼性は棋譜により変わります。
さて、強い人の棋譜ではどうなるかということで、プロ棋士の棋譜を対象にこのグラフを描いてみると、グラフの様子が変わります。続きはまた後日に。