Bonanzaの保木さんのような人格者が仮に電王戦に出れば「電王戦に出て、色々ソフトの改善点が見つかった」みたいなことをおっしゃるわけですが、はっきり言わせてもらうと、電王戦(に出場すること)はソフトの改良する上で何の参考にもならないと思います。
仮に事前貸し出し時にやねうら王が負けた棋譜が1000局ぐらいあったとしても、どうすることも出来ません。
評価関数のパラメーターは機械学習で調整されているので、人間の手心が加わる余地はあまりないですし、定跡で悪い変化に突っ込んでいたとしても、今回のやねうら王やPonanzaの定跡は自動生成型の定跡ですので、負けた棋譜をもらったところでどうすることも出来ません。
もしかすると電王戦でプロ棋士の解説を聞いて、それにインスパイアされて何かを思いつくことはあるのかも知れませんが、AWAKEの巨瀬さんは元奨励会、Ponanzaの山本君は将棋倶楽部24でR2400相当(ウォーズ5、6段レベル?)、私も一応は将棋ウォーズ(最高で)四段なので、プロ棋士の指し手の解説を聞いたぐらいでソフトの改良方法が思いつくということはまずありえません。
そんなわけでして、上位ソフトの開発者は、プロ棋士の自分のソフトとの対局棋譜なんか要らないし、見るのすら面倒くさい、プロ棋士の解説も聞くだけ時間の無駄というのが本音だと思うのですが、どうでしょうか。
あー、でも巨瀬さんはfloodgateのAWAKEの対局棋譜見て、AWAKEが悪い定跡に突っ込んでいたらその定跡を手で編集したりしていると言っていたので、巨瀬さんは「定跡部分は参考になる」と答えそうな気も。
そして、Ponanzaの山本君やAperyの平岡さんは将棋自体を楽しみそうなので、「(プロ棋士の解説や、自分のソフトとプロ棋士との他対局棋譜は)将棋ファンとして楽しめるけど?」みたいな回答をしそうな気が。
あと、Seleneの西海枝さんは、将棋の棋力は入門レベルらしいので「プロの先生の解説がとても参考になりました」みたいなことを言いそうな気が。
え、ちょっと待って…。
「電王戦でのプロ棋士の解説も、プロの貸出時の棋譜も何の参考にもならない(キリッ」みたいなことを言うのは私だけなの?なにこれ。私がおかしいの?
そんなわけで、将棋ソフト開発者の皆さん、コメント欄にコメントお待ちしております。(笑)
いや、わりかしマジで電王戦から何をどう学んで、どうソフトの改良に活かせばいいのか誰か教えろください。
自分は開発者ではありませんが。
貸し出した時の棋譜の質ってどんなもんなんでしょうね。
コンピュータハメようと思って手心加わってるような棋譜を定石に混ぜて大丈夫かな?と思います。
やねさんの主張もよくわかります。
解説などの要素が多分やねさんの道とシンクロしないんだと思います。
でも彼らをデバッガとして割り切った場合、精鋭がデバッグやってくれるんですから、永瀬さんのような不運を沢山誘発してもらうのもいいかもですね。
やねさんならそんな穴ないですか。そうですか。
棋譜は結果論ですけど、プログラムでいえばソースコードだと思います。
それをどう読むかのセンス次第でまた有用性も変わってくるんじゃないでしょうか。
> それをどう読むかのセンス次第でまた有用性も変わってくるんじゃないでしょうか。
そうですね。そのセンスが私には無いと言うことです。何も感ずるところがないと言うことですね。精神的インポテンツです。インポ2.0です。そういや「チンポ2.0」でGoogle検索すると私のブログが検索結果1位になります。生まれてきてごめんなさい。
なんでそんなに自虐的なんですか。
ちんぽ2.0あればドラゴンとか産めそうですけど。
母体が耐えられるか不安ですが。
バグを見つけるのは、デバッグ/デバッガーではなくて、テスト/テスターですよね。
あえてやねさんも突っ込んでいないのかもしれませんが、ニコニコのコメントを見ていてもあまりにも同様の間違いをしている人が多いので気になりました。
デバッグまでやってくれたら開発者は嬉しいだろうなぁ・・。
バグを取る作業だけでなくバグを見つける作業込みでデバッグと呼ばれることは多々ありますね。私はあまり気にしてませんが…。
ダスバッグと呼ぶことを提唱するんだぜ~☆ 出すバッグ☆www
正しく動くことを調べるより、バグを再現することが俺すげぇ感があって面白いんだぜ~☆
バグを潰すのがツブバッグ☆ww バグが無いことをテストするのがノーバッグ☆www
これぐらいやれば論争に終止符は打たれるだろうなんだぜ☆www
将棋倶楽部24の棋譜も意味がないんですか?
例えば入玉関係で負けた棋譜が1000あったとしてもやはり役に立たないんですか?
コンピューター側の入玉の指し手から学ぶとかえって弱くなると思うので人間側の指し手のみしか使えないので1000局分あっても実質は500局分。棋譜の数が一桁足りない気はします。
えー、本題からはズレていると思いますがw
将棋×育成でアプリが作れませんかね?思考エンジンはしっかりしてるけど、定跡は無知。ウォーズみたいに定跡をアイテムとして扱うような。
ユーザーは直接教えることも対戦で学習させることもOKみたいな。
もちろん課金すればレアな定跡が手に入るかも!
棋譜からエレメントを取り出して評価関数に反映するプロセスはやねさんの話を聞いているとちょっと重そうなのでそのコンピューティングリソースをユーザー分用意するのは結構しんどいんではないでしょうか。
ある程度フラグでコントロールすると軽くはなりますけど、自由度の点でごっそり抜けおちるような気がします。
実現にはそれなりの規模の鯖やクラウドが必要に思います。
あぁ、そうだ。
将棋ソフトはCPUをフル稼働させるので、携帯などで実行するときは結構電池食うと思うんですよね。
その兼ね合いもあってローカルでゴニョゴニョするというのは結構非現実的かもしれません。
なのでそれなりの規模の上位リソースがいります。
レアな定跡のためにコンプガチャを回す…。胸が熱くなります。
確かに学べることは少ないと思うけど、デバッカのログに突っかかるプログラマなんていないですよ。
ということで本題とはそれるので質問なんですが(質問に質問を返して申し訳ないです)、なんで将棋ソフトの開発者はプロのプレイヤに対して喧嘩腰なんですか?将棋連盟に課題があるというのは別の問題だし。山ほどプレイしてくれたデバッカに対しても、あるいは心血注いでプレイしてきたプロに対しても「お前らのプレイからは学ぶものはない」とか事実でも私には言えないなあ・・・「プロにハンデ付ける方法って難しい」とか憔悴してる人の前で言う人には難しい感覚かもしれませんが。
私は、特にプロ棋士に対して「喧嘩腰」というつもりはないです。
どっちかというと、「(将棋ソフト開発者は)プロに事前貸出でデバッグしてもらってるだろ」「(将棋ソフト開発者は)電王戦に出て参考になっただろ」みたいなことを言う将棋ファンがいるので、私としては全く参考にもしてないし、全く参考にもならないと言うことを将棋ソフト開発者の誰かがハッキリと言っておく必要があると思いまして、本記事を書きました。
同じことを伝えるにももっと違う言葉があるとは思いますけどね。
「喧嘩腰」だと取られないように真実を伝えることは可能だと思いますし。
そういう言葉遣いができる人を見ると、この人は本当に頭の良い人だなあと思います。
そういうのは人格者とかそういうのではなく頭の問題だと思いますので。
はてなブログやまとめブログを見ても、アクセス数を稼ぐためにギョッとする言葉遣いがされることは多いですし、それがネット文化で、やねさんはネットの住人なんですよ…
開発者のみなさんもいろいろなしがらみがありそうです。
そんななかで割と自由に「本音」を言ってくれる人は貴重な存在であります。
そうでなければ「知る事のない事実」が歴史に埋もれてしまいますので、、、。
人間は現在の将棋ソフトからも「怒った」とか「反省した」とか「あきらめきれない」とか(客観的には)存在しない感情を読み取るし、やねさんからも「喧嘩腰」という存在しない感情を読み取る、不思議な動物
いや、プロ棋士に対して喧嘩腰ではないけど、ネットの匿名者に売られた喧嘩を買ってるのだから、喧嘩腰というのは間違ってないのか…
ほほう、怒らないでくださいね。
>(客観的には)存在しない感情
「客観的に存在する感情」ってあるのでしょうか?と思わず聞きたくなってしまいます。
僕はないと思っています。というか、客観的に定義されてないと思ってます。だからクオリアとかは科学が扱う対象ではないんですね。
Stockfishのことなら何でも知っているやねさんに質問です。
Stockfishも評価関数を使って探索してると想像しますが、たしか人の棋譜で学習していないとか。(?)
それではいったいどうやって評価関数を作っているのでありましょう?
駒割、位置評価と駒の可動性だけなので比較的少ない棋譜からそれなりの値に収束させられるのではないでしょうか。大規模なパラメーターを持つ機械学習が難しいだけで、これくらいの数のパラメーターであれば手で調整してもどうってことないという..
、、、、参考になりませんか。
やっぱりここは「やねうら王 2015」に期待しましょう。
しかしそうなると「Stockfishは評価関数が素晴らしいから人を超えた」訳ではなさそうですね。
残るは「探索方法の優秀さ」とハードウエアの進歩ですか。
、、、「やねうら未来探索の開発」、期待しております。
Stockfishついでに便乗してもう一つ質問してよいでしょうか。
Stockfishは未だ改良され続け、「彼らは人間を作ろうとしてるんや」と気づいたということですが、開発者はチェスや将棋以外に具体的にどういった問題を解くことを想定しているのでしょうか?直接「機械学習のこの問題に応用できる」とかあるんですかね?
> 具体的にどういった問題を解くことを想定しているのでしょうか?
大規模な組み合わせ最適化問題ですね。人間の知的活動は、結構この問題に帰着することが多いですしお寿司。
なるほどー、参考になります。
毎度回答ありがとうございます。
> 具体的にどういった問題を解くことを想定しているのでしょうか?
「アトムは作れるのか?」という「具体的な問題」を解こうとしているのだと勝手に妄想しております。
他の開発者の方について語っている部分が,その人の開発者としての視点と将棋ファンとしての視点がごっちゃになっているようですが,ソフト開発に参考にならないのは共通の認識なのではないでしょうか。第2回の習甦の無理気味の桂跳ねの頃から,ソフトが例え悪手を指すとしても個別に対策できないというのは見ている人にも分かっていると思います。
見て楽しむのも無駄と言うかもしれませんが,趣味なんて無駄だから面白いようなものですし。ひょっとして事あるごとに「電王戦の経験をどう生かしますか?」「無理です」みたいなやり取りをさせられて,ちょっとキレてますか?
> ソフトが例え悪手を指すとしても個別に対策できない
ほんと、そうなんです。でもそこがわかってない将棋ファンがいて、「プロ棋士はお前ら(開発者)のために指してくださってるんだぞ!」みたいなことを言ってくるわけです。私は指してくれなんて一度も頼んだことすらないというのに…。(´ω`)
プログラミングに関しては小学生の頃に少しはまったことがある程度の素人です。
将棋ソフトの構造についても電王戦で大まかに理解した程度です。
それでも棋士の先生方との対戦の棋譜がソフトの改善の参考にならないのは論理的すぐわかりますね。
あまりにも当然すぎて何をいまさら的な印象すらあります。
ソフト応援側の人達が「棋士は棋譜の提出してないの?棋士はずるい」みたいな発言を見たことがあるので、やねさんがはっきりされたのは良いことだと思います。
伊藤さんが塚田さんの練習棋譜を喜喜として?!公開されてたのはいまだに意味不明ですが。
> 伊藤さんが塚田さんの練習棋譜を喜喜として?!公開されてたのはいまだに意味不明ですが。
そのころは、ソフトがプロ棋士の平均的な棋力を超えたのかどうかもハッキリしない時期でしたので公開には一定の意味と意義があったのではないでしょうか。
いま、仮に羽生さんと自分のソフトとの対戦棋譜が1000局分ぐらいもらえたとしても開発者的には扱いに困りますが、将棋ファンとしては盤上で並べてみたい気はします。
それは羽生さんが負ける所を見ることになるのでは…?
1曲ごとに進化するんじゃ無かったんかい!!!
・究極進化!やね裏学習メソッド
従来将棋ソフトのように評価関数を棋譜から学習するタイプの学習ではなく、一局一局から定跡を自動学習するやね裏学習メソッドを採用。一局ごとに進化する世界初のコンピューター将棋ソフト。
話は変わりますが、第25回世界コンピュータ将棋選手権 参加者アピール文書が出そろってますんで、やねうらお氏の目で見て「これは楽しそうだ」みたいなのあれば教えていただきたいです。
大会の開催期間中に記事にしたいと思っています。
Q. 「プロ棋士の解説も聞くだけ時間の無駄」と「羽生さんとの棋譜は盤上で並べてみたい」が、どうも矛盾するように感じるのですが…
1. 自分に十分な棋力があるので解説は無駄。例えばNHK杯の解説も楽しめない。
2. 現状の電王戦出場棋士との対局棋譜は楽しめないが、羽生さんレベルの棋譜なら楽しめる。
3. ソフトの棋力向上にとっては無駄と言っただけで、ファンとしてならプロ棋士の解説も楽しいよ!無駄と書いたのは「(ファンとしてではなく)開発者として有り難がれよ!」と言ってくる一部の人に向けて選んだ表現だよ!
4. その他
1.ですね。私はプロの解説が役に立ったことは一度もないので(自分で何らかの将棋ソフトで検討するほうが深い理解が得られる)、プロ棋士による解説は(自分には)必要だとは全く思わないです。
ふおお。
「プロ棋士の解説が時間の無駄だと感じるのは一定の棋力を持ちつつ(山本君や平岡さんと違って)人間解説よりソフト検討が好きなわたしにとっての話。この世にとって無駄だと言ってるわけではもっっっちろんないので、一部の将棋ファンは誤解せずに正確に文意を読み取っていただきたい。」という感じでしょうか?わかりません><
しかし「(プロ棋士との棋譜は)見るのすら面倒くさい」けど「(羽生さんとの棋譜なら)盤上で並べてみたい」というのは、かなりきわどいところでしか成り立たない気がしまして。
1. 基本的に面倒くさいんだけど羽生さんレベルなら「かろうじて」並べてみたい
2. 言葉のあやだよアホ!
3. その他
1.ですね。羽生さんの対局棋譜なら話題性がありますしね。
私の将棋の上達法としては次の記事が参考になるかも知れません。
http://d.hatena.ne.jp/yaneurao/20130311#p1
リンク先の記事について。プロ棋士の田村さん(今はどうか知らないけど、当時早指しで有名だった)が以前、「詰め将棋は面倒なのでほとんどやってない。実戦を指しまくってここまで強くなった。」と将棋世界かなにかで言ってました。だから読みの速度と深さを集中して鍛えるだけでなく、評価関数を集中して鍛えても、人によってはプロになれるみたいです。
実戦だけ指してもある域の人たちには読みの訓練になるんでしょうね…。初心者にはお勧めできませんが。
事前貸出しに関して質問です。
本番で研究を外すためには、定跡の日付指定で簡単に実現可能かと思うのですが、これはさすがにまずいですか?また、ルール上、そのような本番にフォーカスした恣意的なプログラミングは禁止されているのでしょうか?
こちらが参考になるかと。
http://yaneuraou.yaneu.com/2015/03/17/apery%E3%81%AE%E4%B8%8D%E5%8F%AF%E8%A7%A3%E3%81%AA%E3%83%9F%E3%82%B9%E3%81%AE%E4%BB%B6/#comment-806
http://ex.nicovideo.jp/img/denou/tournament2014/pc/denou_tournament_rule2014.pdf
8ページ目第25条
第3回将棋電王戦と同様、12月から本番までの期間、プロ棋士によるソフトの事前研究が行われる。
プロ棋士の事前研究の効果を意図的に弱めるプログラム(特定条件下で棋力や指し手が異なる等)は
認めないものとする。
そうですね。当日だけ指し手が違うとそれに該当しそうですよね…。
現状はバイナリーコードの提出だけの義務ではなかったかと、、、。
そうするとやっぱり開発者の皆さんにとっては「紳士協定」でしかないようにも思えます。
ソフトが人を越えたわけですが、
今後、人間同士の将棋の対局は
どのようなことを注意しないといけないのでしょうか?
名人戦など、裏でこっそりソフトを使って検討など出来ると思いますし。
それを規制していく必要があるのか。。。
ぜひやねさんが思っていることを
聞いてみたいです。
まあ、発覚すれば将棋連盟から除名は免れないでしょうから、好んでする人はまずいないのではないかと思うのですが。
それでも、小型PC・スマホ持ち込み禁止、X線検査、電波のジャミングetc…をしないといけない時代が来るのかも知れませんが。
発覚は除名処分なのですね。
タイトル戦にせよ順位戦にせよ、
勝負の一戦では名誉と大金が動きますので、
ソフトを使った不正?は、
一度手を染めると麻薬のようになってしまわないか
と考えていしまいます。
親しい仲間(家族等)の電話一本でも、
次の一手のヒントや、詰みがわかるわけですから。
※2chや何らかの掲示板でも、現状の分析結果
を見たくなくても見ることができますし。
今後は待ったなしで、
ルールの緊急策定が必要そうですね。
紳士協定ではなく、
しっかりとしたルールを策定しないと
グレーゾーンでの活動が見過ごされそうです。
今も名人戦の最中ですが、
人同士の棋戦を純粋に楽しめるような、
わかりやすいルールの策定を将棋連盟が
規定してくれることを願っています。
やねさんの抜けの無い視点が、
この方面でのルール策定に必要だと思いますので、
ぜひ、将棋ファンのためにも
本件のアドバイザー的な
ご活躍も勝手に楽しみにしております。
追記です。
最新の将棋ソフトの入手ルートは
どうなっているのでしょうか?
先の電王戦では貸出PCがあったわけですので、
HDDのイメージをコピーしておけば、
別のハードに入れて検討できるのか?
※貸出のソフトは対戦しかできない?
※棋譜入力は出来ない?
あるいは、通常に入手できる将棋ソフトでも、
将棋の棋力は、人を超えられるのか?
もし、通常に入手できる将棋ソフトでも
十分な棋力があるなら、
本当に待ったなしでルールを
検討して欲しいところです。
> 先の電王戦では貸出PCがあったわけですので、
なんか将棋会館にも貸出PCが置いてあって、電王戦参加ソフトとはプロ棋士なら誰でも対戦できるようなので誰でもUSBメモリに入れて持ち帰ろうと思えば持ち帰ることが出来そうではあります。(内情は知りませんが)
> ※貸出のソフトは対戦しかできない?
将棋所から使える思考エンジンですので特定局面の検討にも普通に使えます。
てっきり「シングルユーザー契約かな」と思っていましたが、、、。
チェスで行われてるカンニング対策をそのままもってくればいいんじゃないですかね
Aperyの平岡さんが
序盤定跡の粗に限っては学べるでしょうね。逆に他の部分で何かソフトに反映するのは難しいけれど。
棋譜が貰えるなら公開して棋譜を並べたい人が並べてくれれば良いとは思う。
ってツイートしてます。
なるほろ、なるほろ。
今回は稲葉さんも「(やねさんに)あまり関わりたくない」とか、やねうら王のイメージキャラの容姿の悪口とか失礼なことを言ってるのでその必要はないでしょうけど、そもそも性格の良い(謙虚な?世渡り上手な?卑屈な?)プログラマは自分の作ったプログラムを使ったり、その感想を言ったりされるだけでも感謝するんじゃないでしょうか。面倒くさいとか時間の無駄とか言わずに。
やねうらおさんが、プログラミングで飯を食ってる、正真正銘のプロだという視点が欠けているのではないですか。そういう態度は、技術の安売りに繋がりかねません。
もちろん開発の手間・費用相応の金をもらった上でです。そういう態度の方がよく売れるでしょう。今回はソフトを売ってる訳じゃないので、やっぱり卑屈な態度は要りませんね。
詰出零子(でしたっけ?)さんの件ですが、やねさんが稲葉さんに「よくも私の娘を侮辱したな!!!」って激怒したら面白かったと思うんです。
自分で書き忘れておいて、それを指摘されて「もちろん」などと言うのは失礼でした。ご指摘ありがとうございます。
役に立つか立たないか、というより、そういった粗があって放置されてる時点でそれ以外がどんなに優れていようが、糞ソフトと言われるのは仕方ない事かと。
だってプロ棋士側で言えば「その手指されたら勝てないけど、それ以外なら勝てるからその手はやらないでね」って言ってるって事でしょ?
そんなプロ棋士は糞でしかないよ。
1000局が全部ガチならやねうらおさんの言い分も解らなくはないけど、その中に明らかな嵌め手があった場合には参考になるというか何とかしなきゃダメなんじゃないですかね?
もう少し補足すると、嵌め手と言われる手は打つ直前まではcom側は「最善の一手」と判断している訳で、でもプロ棋士からすると「絶対に打ってはいけない手」でもある事が判っている手として扱われている訳で、その違いから「今のコンピュータ将棋で採用されているものとは別の方式が追加で必要なのかも」とも思ってしまうのです。
ていうか何となくなんですけど、盤上にある駒を動かす時と持ち駒を貼る時の評価方法が同じなのがいけないんじゃないんですかね?
銀鋏み以外の嵌め手って駒貼り時が多いように感じるんですが気のせいですかね?
評価関数を改良するなどして棋力が上がるか思考時間増やせば自然と解決する問題だと考えられるので、特定局面に対するアドホックな解決は一切したくないというのが開発者共通の本音だと思いますよ。
うーん、自分が言ってるのは特定場面でのアドホック的な感じではなくて、単に貼り駒時の評価が変に高過ぎるのかもと思っての解決アプローチ提案なんですよ。
↓でもあるけどソフト側の課題・問題として、想い出王手、不成り読まず、安易な角打ち、って挙がってるけど、これらの共通点はやっぱり「貼り駒が問題起点」になってる気がしていて、その評価がおかしいから嵌め手に誘われちゃうんじゃないかな、と。
思考方式が間違ってたら時間が増えても解決しないんじゃないかなぁ、なんて思った訳です。
> 思考方式が間違ってたら時間が増えても解決しないんじゃないかなぁ
何をもって「思考方式が間違っている」とおっしゃっているのかは私にはわかりませんが、単純なαβ探索においても時間を増やせば増すほど棋力が上がることは実証されているわけですから、そういう意味では「思考方式は間違っていません」し、思考時間が増えれば(銀挟みにあうとか、安易に角を打つとかは)解決することも保証されていると言えます。
>何をもって「思考方式が間違っている」とおっしゃっているのか
言うなれば、時間が短い場合には安易な角打ちをしてしまう方式を採用している事、でしょうか。
ソフト側が時間を掛けなければ最適解が見つからないのに対して、人側は瞬時に悪手だと判る差が自分にも良く解らないので、漠然と今のソフト側の方式の延長線上で進めるだけで良いのかな、なんて事を思ったんです。
> 言うなれば、時間が短い場合には安易な角打ちをしてしまう方式を採用している事、でしょうか。
私は別にそれを「思考方式が間違っている」とは全く思いませんね。プロ棋士でも1手詰めや3手詰めを見落とすことはありますが、それを「思考方式が間違っている」とは言わないのと同じで。ちなみに、いまのコンピューターであれば1手詰めは1秒間に1000万回ぐらい解けますから、コンピューターが1000万分の1秒でわかることを人間はわからないことがあるということですね。
ん?
>プロ棋士でも1手詰めや3手詰めを見落とすことはありますが、それを「思考方式が間違っている」とは言わないのと同じで。
いや、それは思考方式が間違ってたから見落としたんじゃないの?
というかもしかして「思考方式」という言葉の定義がズレてますかね?
あなたの条件を満たすような「正しい思考方式(思考方法)」なんてものはどこにも存在しなくて、世の中には、計算機にとって効率のいい思考方法、人間にとって効率のいい思考方法があるだけだと思いますよ。
> 貼り駒時の評価が変に高過ぎる
あと「貼り駒」の意味がわからないです。「駒打ち」とはどう違うんでしょう?
また、将棋ソフトは駒打ちに対して特別な評価値なんかついていないです。移動させてその場所に到達しようが、駒をその場所に打とうが同じ局面に到達するのであればその2つの局面は同じ評価値となります。
言葉を作ってしまった感はありますが、単に「駒打ち」とは少し違って使っているかもしれない。
駒を打った直後の事を言いたいのではなく、「動かすだけでは到底辿り着く事の出来ない局面となるような駒の状態」を言いたかったんですが、これで少しは伝わります?
何ていうのか「あってはいけない所に駒がある異物感というか違和感」ていうのか、いや実際に打てるんだから異物感も違和感もへったくれもないんですが、そこはお前の居場所じゃないんじゃない的な何かそんな感じ。
意味はわかりましたが、「そこはお前の居場所じゃない」かどうかを探索(先の局面を調べていくこと)なしに評価関数のみで判定するのはいまの将棋ソフトには不可能です。実際のところ人間も探索なしでは不可能なのですが(例えば銀バサミの銀が本当に無駄死にしているかどうかはかなり先まで読まないと判定できないことが多いです)、このへんは人間のほうが局面の評価精度が優れているので将棋ソフトより少ない読みの量で済むことが多々あります。
だからと言って人間の挙動を真似るのが計算機的に効率がいいわけではないと考えられるため、また、どうやって真似るのがいいかアルゴリズム的にも自明ではないため、そういうアプローチでやっている(+やろうとしている)上位のソフト開発者は居ません。
かと言ってそういうアプローチが不可能だというわけでもないでしょうから、あなたが出来ると考えるならチャレンジすることには意義があると思いますよ。
今回の電王戦、ソフト側の課題点・問題点が多数出た大会だったと思います。具体的に言えば「ファミコン時代から進歩のない想い出王手連発」「不成を一切読まない」「安易な角打ち込みによる角捕獲」。これらはどれも昔から続く問題です。
勿論ソフト同士の対局での勝率だけを求めるなら瑣末な問題なんでしょうけど、プログラムを作品として考えるなら、未完成品ともいえる状態が何十年以上続いてるわけで、どうも自分には開発者は「強さとは関係がない」というのを言い訳にこの難題から逃げてるだけにしか見えないのですね。
強さに関してはプロレベルあるいはプロ超えしている現在、開発者が本気で取り組むべきところは上記のソフト特有の欠陥の除去だと思うのですがどうですかね?
思い出王手はともかく、不成を一切読まないに関しては実戦上は欠陥だとは私は思わないです。不成で詰む局面は、そもそも駒の利きが働きすぎる局面であって、その少し手前の局面から見ると不成を使わなくても何らかの勝ち手順があると私は考えています。
任意の角不なりが有効な局面に対し、それより手前の局面でその局面より有力な局面が存在する
という命題はさすがにキツすぎないすか?
離散的なゲームである以上、局面の有用性は離散的に変化していくわけで、
その隙間をつくかのような局面が反例としてあってもおかしくない
実用上無視できるほど小さいことはあるかもしれないが、ゼロであることは本当にあるか
あるいは計算資源の使い方として角不なり局面を潰すことが本当に効率が高いといえるでしょうかね。
> あるいは計算資源の使い方として角不なり局面を潰すことが本当に効率が高いといえるでしょうかね。
言えます。探索中に角不成等を生成する(そしてその指し手を探索する)と勝率が明らかに下がります。
最後の一言はちょっと説明足らんかった
直前の局面で不なりを使わず勝てる局面を探す計算資源コストと
不なり考慮の計算資源コストを比べて
任意の局面で後者が劣るというのは苦しいんじゃね?ってこと。
こんだけ探索空間が広いとそれっぽく反例が見つかってもおかしくない
> 直前の局面で不なりを使わず勝てる局面を探す計算資源コストと不なり考慮の計算資源コストを比べて
私にはその比較に意味があるように思えないです。(例えば)ponanzaが指して、ponanzaが負けた棋譜に対して、ponanza側に不成を考慮していれば勝ちがあった局面が出現している可能性がゼロではないとおっしゃりたいのだと思いますが、少なくともゼロに限りなく近いことは間違いないので(私はここは探索深さが深くなればゼロに収束すると考えていますが)、ここが仮にゼロではないとしても、だからと言って、不成りを考慮したほうがいいという結論にはならないです。ゼロの限りなく近い事象を考慮することで探索時間を無駄にすれば間違いなく棋力は低下するので。
今日明日の食費もままならないのに,老後を考えて年金保険に入るのが完成された人生みたいな話。
初めてコメントさせていただきます。
一つお聞きしたいのですが、定跡データを利用しているのに対局した棋譜がいらないというのがイマイチわかりませんでした。
定跡として有効とされているものを選択的に利用しているから、単純に対局した棋譜だと扱いに困るということでしょうか?
定跡データ、今回おもてなし定跡はプロ棋士の棋譜から作っていますが、やねうら未来定跡や、Ponanzaの定跡は何も参考にせずに自らの探索だけで生成しています。やねうら王のほうはあまりうまく行っていない感じもしますが、Ponanzaのほうは一定の成果は出ています。ゆえに、プロ棋士の棋譜は定跡DBの参考にもならない(しなくて良い)と言えます。
えーと、「評価関数の学習にはプロ棋士の棋譜を使う」というのは電王戦の5つのソフトとも共通。
そうやって作り上げた評価関数でソフトが自分で探索して作り上げたのがポナンザ定跡。
従ってポナンザ定跡はどこかの本に載っている定跡をコピーしたものではない。
、、、という理解でよろしいでしょうか?
> 電王戦の5つのソフトとも共通。
Ponanzaはfloodgateの棋譜で、やねうら王は自己対戦棋譜ですね。AWAKEは知りません。AperyとSeleneはたぶんそうです。
> ソフトが自分で探索して作り上げたのがポナンザ定跡。
まあ、そうなのですが、ただ、「自分で探索」の「探索」は、通常の探索部ではないです。詳しいことはオープンにしていいのかわからないので書きませんが、通常の探索部では探索していないとだけ書いておきます。
>やねうら王は自己対戦棋譜ですね。
えっ、それは認識していませんでした。
それでも、自己対戦するにはまずは何らかの評価関数が必要ですよね。
そのゼロ次評価関数は、、、
1、やねさん手作り
2、プロ棋士の棋譜から学習させたもの
3、その他
やねうら王のゼロ次評価関数はfloodgate棋譜から学習させたやつですね。この部分、もっと弱いソフト(例:ひよこ将棋)から学習させてもどうせ棋力が上がる方向に収束していくのでしょうから、であれば人間の棋譜なんてそもそも要らないよねというのが、いま実験しようとしている「ひまうら王」のベースとなるアイデアです。
素人の質問に答えて頂いてありがとうございます。
そもそも、定跡自体が過去に誰かが対戦して積み上げたデータベースだから、手っ取り早くはあっても、最初から自分の対局や探索でDBを積み上げれば、いずれ強くなるのは変わらないから必要ないということですか。
ということは、最終的に評価の仕組みが確立すれば、そもそもプロだろうがソフトだろうが関係なく、いずれ棋譜すら必要なくなるような気がしてきました。
「人類の棋譜からの卒業」ですか。
そうなると本当に「将棋のルール+論理的探索だけ」という究極の姿になりますね。
「ひまうら王」の実験結果を待ちたいと思います。
、、、と言う訳で、松田さん。
事前貸し出しでの対戦棋譜は入手できたとしても、それを有効活用できる場面がどうやら「やねうら王」にはなさそうでありますね。