この商品をご覧のお客様は、こんな商品もチェックしています。
- 文明の生態史観 増補新版
-
価格:1,320円(本体1,200円+税)
【2023年10月発売】
- うそつきのパラドックス
-
価格:1,980円(本体1,800円+税)
【2001年12月発売】
- ベトナム語北部方言の音節論
-
価格:7,700円(本体7,000円+税)
【2023年03月発売】
- デザイン人間工学
-
価格:3,080円(本体2,800円+税)
【2014年03月発売】
- サブカルチャーの心理学
-
価格:2,750円(本体2,500円+税)
【2020年08月発売】

























[BOOKデータベースより]
人より強い将棋プログラムを作る!Python、Chainerによる将棋AIの作成を通して、ディープラーニングのしくみをより深く理解。AlphaGo、AlphaZeroで用いられた手法も解説。
第1部 導入編(コンピュータ将棋について)
[日販商品データベースより]第2部 理論編(コンピュータ将棋のアルゴリズム;コンピュータ囲碁のアルゴリズム;AlphaGoの手法;ディープラーニングについて)
第3部 実践編(ディープラーニングフレームワーク;方策ネットワーク(policy network);将棋AIの実装;学習テクニック;価値ネットワーク(value network);モンテカルロ木探索;さらに発展させるために)
付録
将棋プログラムの作成を通してディープラーニングをより深く理解できる。
2016年3月、プロ棋士に勝つには後10年かかると言われていたコンピュータ囲碁でDeepMindが開発したAlphaGoがトップ棋士に勝利しました。そのAlphaGoで使われた手法がディープラーニングです。
AlphaGoでは局面を「画像」として認識し打ち手の確率と局面の勝率を予測することで、次の打ち手を決めています。画像とは具体的にどのようなものか、次の打ち手をどうやって決めるのか?AlphaGoの論文をヒントに、ディープラーニングを使い棋譜を学習した将棋AIの開発を行います。強化学習のみでトップレベルの強さを持つAlphaZeroで用いられた手法についても取り入れています。
[導入編]では、コンピュータ将棋の歴史とディープラーニングの関係、コンピュータ将棋の大会の概要と参加方法について紹介します。
[理論編]では、実装する将棋AIの前提となる理論について解説します。従来のコンピュータ将棋のアルゴリズム、コンピュータ囲碁で用いられているモンテカルロ木探索とAlphaGoがどのようにディープラーニングを応用したか。基礎的な知識について解説しつつ、これらを将棋AIに応用する方法について述べます。
[実践編]では、ディープラーニングを使った、実際に対局できる以下の3つの将棋AIについて、PythonとChainerで実装していきます。
方策ネットワーク(policy network)を使って指し手の予測のみでプレイするAI。
価値ネットワーク(value network)を使って1手探索を行うAI。
方策ネットワークと価値ネットワークを使ってモンテカルロ木探索を行うAI。
最後に、より強い将棋AIを作りたいという方のために、ヒントとなる情報を紹介します。