1 / 1

商品图片有可能与实物不同,请务必详细阅读商品说明内容

翻译

价格

6,600 日元

( ≈ 299人民币)
数量
1
日本国内运费
0日元
代购手续费

198日元(≈9元)

店铺
Rakuten Books
更多
活动中
03.20-03.24 闪电市场低至93折+满减600日元! 03.20-03.26 BOOK-OFF&HardOff&Netoff无门槛96折! 03.19-03.22 骏河屋×Lashinbang低至95折! 03.19-03.23 竹蜻蜓专线升级!运费最高减290日元! 03.18-03.22 Rakuma娱乐爱好专区低至94折!
不朽の名著、待望の改訂版!強化学習発展の立役者自らが書き下ろした書。「強化学習の考え方とアルゴリズムを明確に簡潔に説明する」という第1版の特長はそのままに、第2版では、発展的手法や心理学・神経科学との関係の紹介が大幅に加筆されています。第I部では、テーブル形式の範囲でできるだけ多くの強化学習を扱い、核となる考え方を単純な設定で進めます。第II部では、そうした考え方を関数近似に拡張します。第III部では、心理学・神経科学との関係、AlphaGoなどのケーススタディ、将来展望について述べています。ますます重要性を増す強化学習について、基礎から応用までを学べる一冊です。[原著]Reinforcement Learning, Second Edition: An Introduction (The MIT Press, 2018)***「第1版は、強化学習の学習者には必読の教科書となっています。刊行から20年の時間が経ち、AlphaGoなどの新しい技術も出てきました。こうした新しい話題をカバーしながら、基礎からしっかりと説明がされているのが、この改訂版です。……強化学習の分野もまだまだこれから大きく発展していくと考えられますが、本書は、現時点で、この分野を学ぶための最もわかりやすく整理された教科書だと思います。」ーー東京大学教授・松尾 豊(監訳者序文より)第1章 序第I部 テーブル形式の解法第2章 多腕バンディット問題第3章 有限マルコフ決定過程第4章 動的計画法第5章 モンテカルロ法第6章 TD学習第7章 nステップ・ブートストラップ法第8章 テーブル形式手法におけるプランニングと学習第II部 近似による解法第9章 近似を用いた方策オン型予測第10章 関数近似を用いた方策オン型制御第11章 近似を用いた方策オフ型手法第12章 適格度トレース第13章 方策勾配法第III部 さらに深く第14章 心理学第15章 神経科学第16章 応用と事例紹介第17章 強化学習のこれから
翻译