こんな大事な本を読み落としていたとは。思い出させてくれた「レジデント初期研修用資料: 終了判定の問題を考えている人がいた」に感謝。

本書を読んで確信できた。

私の目の黒いうちに、電脳が人脳に勝つ日が来ることを。

本書、「ボナンザVS勝負脳」は、現在最も有名なコンピューター将棋プログラムBonanzaの開発者と、それと戦って見事勝利した、勝負脳の持ち主とが、それぞれの立場で持論を読者に遠慮なく語った一冊。

目次
はじめに
第一章 ボナンザ誕生 保木邦仁
第二章 コンピュータとの対決 渡辺明
対談 ボナンザ誕生 保木邦仁 x 渡辺明
第三章 コンピュータ将棋の新たな可能性 保木邦仁
第四章 プロ棋士はこう考える 渡辺明
終章 科学的思考とは? 保木邦仁

本書は読みやすい本とはとても言えない。特に保木担当の部分は、難しそうな専門用語が並んだ、いかにも学者らしい文章が並んでいる。たとえばこんな具合。

p. 28
熟練した人間の棋譜との指し手一致の度合いを測る目的関数を設計し、これに停留値を与える静的評価関数の特徴ベクトルを求める。そしてこの特徴ベクトルがゼロとなる自明な解を除去し、棋譜サンプル数の不足に起因するオーバーフィッティングを回避するために、ラグランジュ未定乗数法というものを用いて、目的関数に拘束条件を課した。

難しそうであるが、乱暴に一言でまとめれば、「ボナンザ君に胃腸を与えた」ということである。あとは餌となる棋譜を食わせていけばいい。それで足りない栄養があったら、それを吸収するためのアルゴリズムを追加するなり調整するなりすればいい。

Bonanzaは、棋譜を喰らうことが出来る。それが意味するのは何か?

弾言しよう。電脳が人脳に勝つ日は、棋士たちが頑張れば頑張るほど近づくのだ、と。

そして棋士たちは、その日が来た時、悔しがるよりも、むしろ慶ぶべきだということを。

なぜなら、ボナンザを強くしたのは、開発者たる保木ではなく、6万局の棋譜を残した、1607年から連綿と続く棋士たちなのだから。

ボナンザのすごいところは、強いこと、ではない。どうやって棋士の経験から学ぶかということを定式化したことなのだ。これが意味するところは、「強いプログラム」を作るとは全然違う。「プログラムを強くするにはどうしたらよいか」ということを発見したに等しいのだ。

そのためには、過去の棋譜をどんどんプログラムに食わせればいい。プログラムは、食えば食うだけ強くなる。

これを見て、何か思い出さないだろうか。

Google、である。

Googleを「賢く」しているのは誰か、Googleではない。我々である。我々が「検索結果はこうあって欲しい」という思いを込めてWebページを作成、更新すればするほど、Googlebotがそれを拾ってそれが検索結果に反映される。「どうやって学ぶか」というアルゴリズムは確かにPageRankという形で与えられているけど、そこに食わせるデータがなければ賢くなりようがないのだ。

これと同じことが、まさにBonanzaにも言えるのだ。

まさに Tim O'reillyの言う通り、Data is the Next Intel Insideである。

棋士達がいい棋譜を残せば残すほど、それはBonanzaをはじめとするコンピューター将棋を賢くする。

ボナンザVS勝負脳 (保木邦仁、渡辺明共著) - My Life Between Silicon Valley and Japan
本書を読み終えて、現時点では渡辺明(23歳)という若き竜王だけが、「コンピュータと戦う」それも「一度限りではなく、コンピュータをも真剣に将棋を戦う相手と認識した上で、長期間、お互いに切磋琢磨しながら戦い続ける」という未来を、自分の人生におけるきわめて重要な問題として、本気で自分の問題として考え抜いている棋士なのだ、ということを痛感した。

恐るべきことに、まさにその渡辺九段の真摯な姿勢こそが、敵に塩を送る行為となるのだ。

そのことに、梅田さんは気がついたのだろうか。あるいは気がついてこういう書き方となったのだろうか。

ドラゴンボールで言えば、Bonanzaはブウで、保木はビビディだ。そして今後のコンピューター将棋プログラマーはすべてバビディとなりうるのだ。

なぜBonanzaが「まだ」弱いか。渡辺九段自身が哀しいほどにその理由を正確に捉えている。

渡辺明ブログ ボナンザ戦補足など。
それに対してコンピューターはあらゆる手を広く考えるので絞って深く読むのが難しいのかもしれませんね。人間の経験のほうが上、ということでしょうか。

「人間の経験の方が上」。そうなのだ。今の、ところは。

Bonanzaが「食った」棋譜は、たったの6万局。これは人脳にとっては大きな数字だが、電脳にとっては仁丹ほどの数字だ。しかし、Bonanza以前は、それを「どうやって食べればいいか」ということが知られていなかった、というよりそういう方向にはプログラマーたちは考えなかった。そこに保木の凄さがある。

特定の作業に関して学習法をプログラムされた電脳は、人脳の産み出した叡智を喰らうことで、いつか人脳を凌駕する。

我々はこのことを悲しむべきだろうか。

だとしたら、我々は我々よりも速く走る車や、我々に出来ない空を飛ぶという行為を実現した飛行機の誕生を悲しまなければならない。「より速く」「より高く」の対象が「より賢く」であったとしても、それを悲しむ必要はあるのだろうか。

どうやら、我々は知恵を電脳に与えた育てる方法に関しては、なんとなくコツをつかんだようだ。

しかし、「何を欲しいか」という欲求は、未だにどうやって電脳に与えていいかのメドが立っていない。それがある限り、電脳は人脳の下僕でいつづけてくれるだろう。将棋に勝つソフトウェアは作ることができるが、将棋をやりたくなるのは、今のところウェットウェアだけなのだから。

Dan the Wetware

See Also: