覇者への道筋

2013年4月であるつい先日、とうとう将棋における、棋士対コンピュータのチーム戦である「電脳戦」において、棋士チーム側の負け越しが決定した。

すでに10年以上前に、IBM社のディープブルーがチェスの世界王者を破った映像は、個人的に脳裏に焼き付いているのだけれど、今回の一連の戦いも、それに負けるとも劣らない戦いを見せてくれた気がする。

 

将棋は、とった駒を自分の駒として再投入できたりすることから、チェスよりもより複雑で、コンピュータ化が難しいとは言われながら、ここ10年たたないうちに、メキメキと力を伸ばしてきた。

 

Wikipediaによると、Bonanza(ボナンザ)というコンピュータ将棋ソフトが開発されたのは2005年。2006年には世界コンピュータ将棋選手権で初出場かつ初優勝を飾ったところあたりから、業界の流れが変わる。

そこからバージョンアップが施され、2007年には棋士 渡辺明竜王との対局が組まれたのを知る人も多いだろう。この取り組みはのちに、NHKのドキュメンタリー番組が組まれるまでにいたる。

その後、Bonanzaのアルゴリズム公開、ソースコード公開を経て、この手法でのコンピュータ側の能力がぐっと手厚さを増していく。

 

2007年以後も、2010年、2012年と、棋士対コンピュータの対戦が持たれた。コンピュータが棋士に勝つこともあるということが明確になり始め、そして今年2013年、団体戦として、コンピュータ側が勝ち越した。常に勝ち続けるということではないものの、トップ級の棋士をコンピュータが負かしたという意味は、大きなものがあるだろう。

 

 

今回の発展のおおもととなったBonanzaの製作者は、実は将棋が強かったというわけではないらしい。であるため、それ以前の将棋ソフトの多くでは、アルゴリズム製作者の味付けで評価関数のパラメータを調整していたところを、Bonanzaでは、「過去の棋譜データをもとに、それを大量に解析し、それをもとにコンピュータ自身が自動でパラメータを生成する」というやり方として開発された。

 

言うまでもないが、コンピュータの強みのひとつ、感情などに左右されず、こうすれば必ず成功する、これは必ず負けるという筋道がわかるものは、絶対忘れない、間違わない、ということだ。結果、Bonanzaはそうした過去の棋譜を大量に学習することによって強くなったわけだけれど、違う言い方をすれば、「過去の記録がなければ、Bonanzaは生まれ出ようがなかった」とも言える。そしてまた、今後記録が残る限り、強さを学び続ける。

 

過去の記録があったからこそ、何が良かったのか、何が悪かったのかを知りえることができ、それを今の行動に当てはめて評価することができる。

 

人間だと、「あぁ、あの時似たようなことやったよなぁ、でもどうだったっけなぁ?」なんてのは、よくある話だ。できる人はそこで、昔の記録を紐解く。よくできた先人は、必ずと言っていいほど記録を残している。

いやこれも、「良い記録が残っている」かつ「すばらしい先人」であったからこそ、先人として尊敬の念を持たれるわけであって、何も残っていない誰かは、その人が偉かったのかどうかすらわからない。もしも当時から本当に偉い人で、その周りの人が記録を付けていればそれでもかまわない。とにかく「記録が残っていること」が、その後の気づき、発展、修正その他の大きなカギになる。

 

最初は間違っていても構わない。だが「それが間違っていた」ということさえ記録されていなければ、記憶の彼方へと消えていく。

“正しいことのみを記録する”ということができれば、最も効率が良いだろうけれど、それはそもそも回答への道が見えているからこそできる技。私をはじめとするような凡人の場合には、駄目だった/間違いだったという膨大な記録の山を生み出す。だがそれこそが、逆に正しい道を浮かび上がらせてくれるはず。まるで迷路の行き止まりを塗りつぶしているうちに、出口へのルートが浮かび上がるように。

 

そうして浮かび上がった道が見えて初めて、“道路”として整備され、後に続く者は、そこを通って、今まで到達できなかったその先へとたどり着ける。