棋譜からの学習のiterationを回しているとprediction(指し手一致率)が上がっていきます。このpredictionが上がっていくとそれが過学習でない限りは棋力が上がります。
Bonanza6のlearn.cの実装ではペナルティが結構きつめになっているので、過学習はあまり起こらないようです。
棋譜からの学習のiterationを回しているとprediction(指し手一致率)が上がっていきます。このpredictionが上がっていくとそれが過学習でない限りは棋力が上がります。
Bonanza6のlearn.cの実装ではペナルティが結構きつめになっているので、過学習はあまり起こらないようです。
将棋の探索空間はどれくらいの広さなのでしょうか。
チェスの場合、1手から最終局面までの手順数(探索空間)は10の120乗程度と言われている。将棋の場合は、10の220乗。一度取った相手の駒を使うことができるため、とたんに増えてしまう。囲碁は盤面の広さもあって10の360乗である。
上の記事に見られるような「10の220乗」というのが定説になっています。
ところが、一定以上の棋力を持つプレイヤーに限定する場合、桁違いに狭いというのが私の考えです。10の220乗どころか、10の50乗すらいかないと私は思っています。
今回紹介するのはStockfish DDの置換表の実装です。
最新のStockfishの実装では置換表の1エントリーがStockfish DDからさらに節約されていますが、ハッシュキーのbit数を減らしてあるのでハッシュ衝突の確率が上がるため一概に良いとは言えません。
事の発端は習甦の竹内さんが、「(2014年の電王戦のために貸し出した)習甦には、色んな定跡を入れておいたところ、それはプロ棋士の先生に非常に喜んでもらえた」と言い出したことである。
「それならワイもやったるで〜」と習甦と同じ手法で定跡を入れようと思った。
本サイトのメインコンテンツ
やねうら王 — 棋力的にトップ集団の将棋ソフトに比肩する将棋ソフト
やねうら王オープンソースプロジェクト — やねうら王miniから最新のやねうら王までのソースコードと思考エンジン本体
ふかうら王 — Deep Learningを採用した新しい時代の将棋ソフト
たけわらべ — 利きだけを理解している新しい感覚の将棋ソフト
Stockfish完全解析 — コンピューターチェスの強豪ソフトStockfishの完全解析
将棋電王戦 — 株式会社ドワンゴ主催の将棋電王戦。やねうら王は4年連続出場
コンピューター将棋全般 — コンピューター将棋全般の話題
プロコン — CODEVSなどプログラミングコンテストの話題
なお、この記事のここから下には新着記事が表示されています。
以前、Stockfishのソースコードの完全解析をしたときの内容を少しずつ公開していきます。
ひよこ将棋(駒得のみの評価関数)×やねうら王 = ひようら王
ひよこ将棋のブログで公開していたものですが、こちらでも公開することにしました。
このブログの上部の「思考エンジンのダウンロード」からダウンロードしてお使いください。
関連記事
いまのコンピューターは評価関数のパラメーターの調整(棋譜からの学習)のために人間の棋譜を用いているが、一切人間の棋譜を用いずに1から独力で評価関数のパラメーターの調整を行い、Bonanza6相当の将棋ソフトを作ることは可能なのか?
※ なお、名前の使用に関して、ひまわり将棋さんの許可は取っていません。「ひまわり」の名前は無断使用です。(^^;
2014年12月25日ごろから2015年1月15日ごろまでにかけて実験を行なう予定です。
なお、実験中に得られた棋譜および思考エンジン+評価関数パラメーターはすべて公開する予定です。お楽しみに。
追記(2015年1月9日)
定跡の生成が終わらないのでPCが空きません…。1月20日ごろからの開始としたいと思います。
ここは、
ためのブログです。
ときどきスポンサーからのアフィリ記事が挟まります。スポンサーに電気代等を出資していただいているので何卒、ご理解のほどお願い致します。