关灯

深入浅出强化学习:原理入门及源代码+PDF+112M

[复制链接]
jxnc6668 发表于 2019-2-13 14:52:20 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题
图书
图书封面:
书名: 深入浅出强化学习:原理入门及源代码
售价: 100 盟币
文件大小: 112 M
质量: 清晰pdf
语种: 中文
分类: 机械工程 » 机械设计
SSID: -
 
深入浅出强化学习:原理入门
作者: 郭宪 / 方勇纯
出版社: 电子工业出版社
出版年: 2018-1
页数: 256
定价: 79
装帧: 平装
ISBN:9787121329180
《深入浅出强化学习:原理入门》用通俗易懂的语言深入浅出地介绍了强化学习的基本原理,覆盖了传统的强化学习基本方法和当前炙手可热的深度强化学习方法。开篇从最基本的马尔科夫决策过程入手,将强化学习问题纳入到严谨的数学框架中,接着阐述了解决此类问题最基本的方法——动态规划方法,并从中总结出解决强化学习问题的基本思路:交互迭代策略评估和策略改善。
基于这个思路,分别介绍了基于值函数的强化学习方法和基于直接策略搜索的强化学习方法。最后介绍了逆向强化学习方法和近年具有代表性、比较前沿的强化学习方法。
除了系统地介绍基本理论,书中还介绍了相应的数学基础和编程实例。因此,《深入浅出强化学习:原理入门》既适合零基础的人员入门学习、也适合相关科研人员作为研究参考。
目录1 绪论 1
第一篇 强化学习基础 17
2 马尔科夫决策过程 18
3 基于模型的动态规划方法 36
第二篇 基于值函数的强化学习方法 57
4 基于蒙特卡罗的强化学习方法 58
5 基于时间差分的强化学习方法 75
6 基于值函数逼近的强化学习方法 88
第三篇 基于直接策略搜索的强化学习方法 125
7 基于策略梯度的强化学习方法 126
8 基于置信域策略优化的强化学习方法 142
9 基于确定性策略搜索的强化学习方法 165
10 基于引导策略搜索的强化学习方法 171
第四篇 强化学习研究及前沿 185
11 逆向强化学习 186
12 组合策略梯度和值函数方法 202
13 值迭代网络 207
14 基于模型的强化学习方法:PILCO及其扩展 214
请点击此处下载

请先注册会员后在进行下载

已注册会员,请先登录后下载

文件名称:深入浅出强化学习:原理入门+源代码.rar 
下载次数:0  文件大小:112.35 MB  售价:100元盟币 [记录]
下载权限: 不限 以上或 VIP会员   [购买VIP]   [充值盟币]  [免费赚盟币]



参与人数 1威望 +1 收起 理由
yeyue130 + 1

查看全部评分总评分 : 威望 +1

回复

使用道具 举报

 
您需要登录后才可以回帖 登录 | 立即注册 微信登录

本版积分规则


40威望

1885盟币

1关注

1粉丝

123帖子

排行榜
作者专栏
登录后可将在线时长兑换成盟币 ,连续在线 [1] 小时后,每小时 [0.5] 盟币.
×

你已累计兑换次数 0

你已累计兑换积分 0盟币

关注我们:微信订阅号

官方微信

APP下载

Copyright   ©2005-2018  博研网Powered by©Myboyan.com    ( 粤ICP备10062441号 )