|
(GPS将棋開発参加記録)
|
詰み専用の探索をどの程度呼ぶと強いのかは、結論を出せるほどのデータがまだないテーマで、現状は3手詰みだけ(Bonanza)だったり、普通の探索節点数の1/N(目標値)を読ませたりとプログラムによって異なっているようです。多数決合議を行う場合等、多様性があるのはおそらく良いことでしょう。
GPS将棋は結果として半分を越えることも良くあり、おそらく一番詰み探索にリソースを費やしていそうです。もう少し減らした方が良い気がするので、まとまった時間が取れたら試してみたいとは思っています。
予想では詰み探索の効果がでる境界は単純ではなくて、持ち時間や詰みを読む局面の選択方法や評価関数等さまざまな条件が関係することでしょう。
先日に続き、 A級リーグ指し手1号さんの記事より
A級リーグ指し手1号さんの記事より。#TSUMIの導入も自然ですが、プロトコルを拡張しないとしてこんな案はどうでしょう。サーバは詰ませた側(合法手のない局面に導いた側)に対して直ちに相手が投了したかのように%TORYO等を送って対局を終了させる。詰まされた側の投了は一応待って消費時間等は記録する。shogi-serverの実装はちょっと複雑になりますが。
しばらく yss4gps4という実験的プログラムをfloodgateで動かしていました。これは名前の通りYSSとGPS将棋の合議バージョンで、1 coreのYSSが4人、1 coreのGPS将棋が4人、それぞれ乱数で評価関数に揺らぎをいれたバージョンの多数決です。ハードウェアは、Opteron 2376 2.3GHz で1プログラムあたり1 coreを割り当てています。一つのプログラムに割り当てられたハードウェアの恵まれ具合は、大雑把にYSSL980X_1cのたぶん半分弱、遅いハードウェアながら2coreを使うBonanzaより少し劣り、1coreで動くgps_lよりちょっと速いといった感じです。
目的は合議サーバとの通信部分の耐久テストでしたが、300試合程度動かしたところまずまずのレーティングで、合議に効果があることの傍証になるかもしれません。現在の二週間レーティングでは下のように単体のYssL980X_1cやgps_lより上に来ています。ちなみにgps_majority_voting8は、GPS将棋8人の合議を同じハードウェアで動かしたものでした。
Bonanza 2660 379 148 0.719 YssLXeon5355_8c 2658 80 28 0.741 bana 2655 208 97 0.682 yss4gps4 2610 200 102 0.662 YssL980X_1c 2571 37 22 0.627 gps_majority_voting8 2525 142 56 Blunder 2415 308 313 0.496 gps_l 2403 303 353 0.462
主だった勝敗の内訳は下のようになっています。多少相性があって、ハードウェアの差からするとYssLXeon5355_8cに勝ち越しているのは出来すぎで、またgps_lに対する勝率0.857はレート差からの期待勝率0.701からすると勝ちすぎ(3%程度の珍しさ)となっています。一方、Bonanzaは苦手にしていて、勝率と期待勝率がそれぞれ0.306と0.438(7%程度の珍しさ)となっています。banaというプログラムに対しては(どのようなプログラムか分かりませんが)、さらに苦手のようです。
YssLXeon5355_8c 14 - 12 - 0.54 - Bonanza 11 - 25 - 0.31! - bana 10 - 25 - 0.29!!! - YssL980X_1c 2 - 1 - 0.67 - gps_l 30 - 5 - 0.86++
合議をするとレートがあがるが、構成内プログラムに対する相性の良さが主要因で他のプログラムに対する勝率の改善は控えめになる、という可能性を調べる必要があるのかもしれません
ところで、この合議用プログラムはまだ投了機能がありません。対戦相手の方、申し訳ありません(__)
おそらくネットワーク関係のトラブルで、今朝9時頃からfloodgateを初めshogi-server@wdoorのサービスが利用できなくなっています。ご迷惑をおかけします。
(8/8追記: 現在使えているようです。shogi-serverは動き続けていて、間のネットワーク機器の不調だったようです)
_ A級 [勝手にネタに使ってすみませんm(__)m 警告やソースの可視性の件は、ユーザ側(私)が勝手にやってる話ですので気に..]
_ kaneko [せっかく公開しておりますので、試していたいてとても嬉しいです。 詰み探索は、持ち時間が20秒以上ある時にルートで1..]