本・コミック: ＩＴエンジニアのための強化学習理論入門/中井悦司:オンライン書店Honya Club com

在庫状況：在庫あり（1～2日で出荷）

ＩＴエンジニアのための強化学習理論入門

価格: 3,278円（本体2,980円＋税）
発行年月: 2020年07月
判型: Ａ５
ISBN: 9784297115159

内容情報
[BOOKデータベースより]

強化学習の基礎となるアルゴリズムを体系的に学ぶ。

１　強化学習のゴールと課題（強化学習の考え方；実行環境のセットアップ；バンディットアルゴリズム（基本編）；バンディットアルゴリズム（応用編））
２　環境モデルを用いた強化学習の枠組み（マルコフ決定過程による環境のモデル化；エージェントの行動ポリシーと状態価値関数；動的計画法による状態価値関数の決定）
３　行動ポリシーの改善アルゴリズム（ポリシー反復法；価値反復法；より実践的な実装例）
４　サンプリングデータを用いた学習法（モンテカルロ法；ＴＤ（Ｔｅｍｐｏｒａｌ‐Ｄｉｆｆｅｒｅｎｃｅ）法）
５　ニューラルネットワークによる関数近似（ニューラルネットワークによる状態価値関数の計算；ニューラルネットワークを用いたＱ‐Ｌｅａｒｎｉｎｇ）

[日販商品データベースより]

前作の『ITエンジニアのための機械学習理論入門』から、5年経過しましたが、AI（人工知能）や機械学習に対しての期待と関心はまったく衰えません。むしろ機械学習の利用はIT業界で当然のものとなり、さらなる活用がさまざまな場所で行われています。前作では一般的な機械学習について解説しましたが、試行錯誤しながら1つの解をもとめていく「強化学習理論」についてくわしく・やさしく解説します。理論を表現するいろいろな数式とそれらをプログラミングするためのPythonコードを並列しながらその理論の神髄にせまり、強化学習の基礎となるさまざまなアルゴリズムを体系的に学びます。

この商品をご覧のお客様は、こんな商品もチェックしています。