ゲスト さん (ログイン)
オンライン書店【ホンヤクラブ】はお好きな本屋での受け取りで送料無料!新刊予約・通販も。本(書籍)、雑誌、漫画(コミック)など在庫も充実
強化学習と深層学習による探索と制御 AI & TECHNOLOGY
翔泳社 伊藤多一 今津義充 須藤広大
点
AlphaGo(アルファ碁)でも利用されている深層強化学習。AIサービスのみならずロボティクス分野でもその応用が期待されています。本書は、AI開発に携わる第一線の著者陣が深層強化学習の開発手法について書き下ろした注目の1冊です。
1 基礎編(強化学習の有用性;強化学習のアルゴリズム;深層学習による特徴抽出;深層強化学習の実装)2 応用編(連続制御問題への応用;組合せ最適化への応用;系列データ生成への応用)APPENDIX 開発環境の構築
注目の最新AI技術!深層強化学習の開発手法がわかる!第一線で活躍する著者陣の書下ろしによる待望の1冊!【本書の目的】AlphaGo(アルファ碁)でも利用されている深層強化学習。AIサービスのみならずロボティクス分野でもその応用が期待されています。本書は、AI開発に携わる第一線の著者陣が深層強化学習の開発手法について書き下ろした注目の1冊です。【本書の特徴】第1部では、まず、深層強化学習の概要について説明します。次いで、強化学習の基礎(Q学習、方策勾配法、Actor-Critic法)と深層学習の基礎(CNN、RNN、LSTM)を解説します。さらに、簡単な例題として倒立振子制御を取り上げ、DQNとActor-Critic法による実装例を紹介します。第2部では、具体的な応用例として3つのアプローチを実装込みで解説します。1つ目は、連続動作制御です。ヒューマノイドシミュレータの2足歩行制御を試みます。2つ目は、パズル問題の解法です。巡回セールスマン問題(TSP)やルービックキューブの解探索について説明します。3つ目は、系列データ生成です。文書生成(SeqGAN)やニューラルネットワークのアーキテクチャ探索(ENAS)を解説します。全体を通して、行動の制御を担うエージェントのモデル化と、方策ベースの強化学習によるエージェントの学習法について学ぶことができます。【読者が得られること】深層強化学習による開発手法を学ぶことができます。【対象読者】深層強化学習を学びたい理工学生・エンジニア
ページ上部へ戻る
この商品に寄せられたカスタマーレビューはまだありません。
レビューを評価するにはログインが必要です。
この商品に対するあなたのレビューを投稿することができます。
本好きのためのオンライン書店
Honya Club.comは日本出版販売株式会社が運営しているインターネット書店です。ご利用ガイドはこちら
藤田直哉
価格:2,750円(本体2,500円+税)
【2025年06月発売】
くるねこ大和
価格:1,100円(本体1,000円+税)
【2008年01月発売】
中本幹子
価格:605円(本体550円+税)
【2004年03月発売】
1位
又吉直樹
価格:1,320円(本体1,200円+税)
【2015年03月発売】
一覧を見る
[BOOKデータベースより]
AlphaGo(アルファ碁)でも利用されている深層強化学習。AIサービスのみならずロボティクス分野でもその応用が期待されています。本書は、AI開発に携わる第一線の著者陣が深層強化学習の開発手法について書き下ろした注目の1冊です。
1 基礎編(強化学習の有用性;強化学習のアルゴリズム;深層学習による特徴抽出;深層強化学習の実装)
[日販商品データベースより]2 応用編(連続制御問題への応用;組合せ最適化への応用;系列データ生成への応用)
APPENDIX 開発環境の構築
注目の最新AI技術!深層強化学習の開発手法がわかる!
第一線で活躍する著者陣の書下ろしによる待望の1冊!
【本書の目的】
AlphaGo(アルファ碁)でも利用されている深層強化学習。
AIサービスのみならずロボティクス分野でもその応用が期待されています。
本書は、AI開発に携わる第一線の著者陣が深層強化学習の開発手法について書き下ろした注目の1冊です。
【本書の特徴】
第1部では、まず、深層強化学習の概要について説明します。
次いで、強化学習の基礎(Q学習、方策勾配法、Actor-Critic法)と深層学習の基礎(CNN、RNN、LSTM)を解説します。
さらに、簡単な例題として倒立振子制御を取り上げ、DQNとActor-Critic法による実装例を紹介します。
第2部では、具体的な応用例として3つのアプローチを実装込みで解説します。
1つ目は、連続動作制御です。ヒューマノイドシミュレータの2足歩行制御を試みます。
2つ目は、パズル問題の解法です。巡回セールスマン問題(TSP)やルービックキューブの解探索について説明します。
3つ目は、系列データ生成です。文書生成(SeqGAN)やニューラルネットワークのアーキテクチャ探索(ENAS)を解説します。
全体を通して、行動の制御を担うエージェントのモデル化と、方策ベースの強化学習によるエージェントの学習法について学ぶことができます。
【読者が得られること】
深層強化学習による開発手法を学ぶことができます。
【対象読者】
深層強化学習を学びたい理工学生・エンジニア