この商品をご覧のお客様は、こんな商品もチェックしています。
- ナショナリズムとは何か
-
価格:1,210円(本体1,100円+税)
【2025年11月発売】
- オールカラー徹底図解 城の攻め方・つくり方
-
価格:1,540円(本体1,400円+税)
【2025年06月発売】
- 日本の城を攻める! お城白熱教室
-
価格:2,200円(本体2,000円+税)
【2025年08月発売】
- いかにして民主主義は失われていくのか 新装版
-
価格:4,950円(本体4,500円+税)
【2025年11月発売】
- TensorFlowで学ぶディープラーニング入門
-
価格:2,959円(本体2,690円+税)
【2016年09月発売】






























[BOOKデータベースより]
強化学習の基礎となるアルゴリズムを体系的に学ぶ。
1 強化学習のゴールと課題(強化学習の考え方;実行環境のセットアップ;バンディットアルゴリズム(基本編);バンディットアルゴリズム(応用編))
[日販商品データベースより]2 環境モデルを用いた強化学習の枠組み(マルコフ決定過程による環境のモデル化;エージェントの行動ポリシーと状態価値関数;動的計画法による状態価値関数の決定)
3 行動ポリシーの改善アルゴリズム(ポリシー反復法;価値反復法;より実践的な実装例)
4 サンプリングデータを用いた学習法(モンテカルロ法;TD(Temporal‐Difference)法)
5 ニューラルネットワークによる関数近似(ニューラルネットワークによる状態価値関数の計算;ニューラルネットワークを用いたQ‐Learning)
前作の『ITエンジニアのための機械学習理論入門』から、5年経過しましたが、AI(人工知能)や機械学習に対しての期待と関心はまったく衰えません。むしろ機械学習の利用はIT業界で当然のものとなり、さらなる活用がさまざまな場所で行われています。前作では一般的な機械学習について解説しましたが、試行錯誤しながら1つの解をもとめていく「強化学習理論」についてくわしく・やさしく解説します。理論を表現するいろいろな数式とそれらをプログラミングするためのPythonコードを並列しながらその理論の神髄にせまり、強化学習の基礎となるさまざまなアルゴリズムを体系的に学びます。