详情 评论 声明
商品详情

课程简介
强化学习,被誉为可能通向强人工智能的第三类机器学习方法,在AI游戏领域的应用已司空见惯,如自动玩flappy bird,借助强化学习玩星际争霸,最近非常火的王者荣耀也不例外;在无人驾驶、自动交易等领域也有着举足轻重的作用。
《强化学习》课程,带你揭秘AlphaGo和星际争霸/王者荣耀,华尔街最热门的自动交易算法背后的技术及无人驾驶的关键点。
课程特色
1)从模型无关到模型相关,从Q-learning到Policy gradient,全面涵盖主流强化学习内容知识
2)与工业级ML算法紧密结合的应用案例讲解
3)配套实验环境与GPU服务器
第1课 强化学习RL简介
知识点1:强化学习定义:可能通向强人工智能的第三类机器学习方法
知识点2:强化学习数学模型:马尔科夫决策过程(MDP)
知识点3:RL机器人:探索环境,规划自己的人生
知识点4:强化学习基本算法分类
知识点5:Model-Based RL: 已知环境,如何优化自己的人生
第2课 Model—Free Learning
知识点1:环境未知,如何评估测略(状态价值)
知识点2:蒙特卡洛方法学习状态价值函数
知识点3:TD方法学习状态价值函数
实战项目:两种方法比较及代码实现
知识点5:OpenAI Gym介绍
第3课 Model-Free Control
知识点1:ϵ− 贪婪策略:平衡 Exploration and Exploitation
知识点2:on/off-policy 蒙特卡洛方法
知识点3:on/off-policy TD 算法 (Sara)
实战项目:on/off-policy 算法比较及代码实现
第4课 Q-Learning
知识点1:Q-Learning
知识点2:Deep Q-Learning
实战项目:Q-learning解决山地车问题
第5课 策略梯度学习
知识点1:蒙特卡洛策略梯度
知识点2:Actor-Critic算法
实战项目:用policy gradient解决连续山地车的问题
第6课 TensorFlow强化学习应用案例
实战项目:使用Deep Q network 和 Policy gradient完成以下游戏:强化学习乒乓球游戏、强化学习flappy bird


百度网盘可以用手机平板电脑在线播放,也可以下载之后播放
VIP免费 / 14 学币 提示:赞助VIP可无限免费下载 加入VIP
立即下载 我要收藏
最新记录
QQ********D 今天 0:53下载了*********!
QQ********F 今天 0:49下载了*********!
QQ********F 今天 0:47下载了*********!
QQ********F 今天 0:46下载了*********!
QQ********F 今天 0:45下载了*********!
QQ********3 今天 0:37下载了*********!
QQ********F 今天 0:18下载了*********!
QQ********F 今天 0:14下载了*********!
QQ********F 今天 0:13下载了*********!
QQ********1 昨天 22:21下载了*********!
QQ********4 昨天 21:28下载了*********!
QQ********8 昨天 21:22下载了*********!
QQ********6 昨天 13:38下载了*********!
QQ********F 昨天 10:54下载了*********!
QQ********F 昨天 10:53下载了*********!
QQ********F 昨天 10:52下载了*********!
QQ********F 昨天 9:58下载了*********!
QQ********F 昨天 9:57下载了*********!
QQ********F 昨天 9:55下载了*********!
QQ********F 昨天 9:53下载了*********!
声明

1、链接失效请联系客服人员。
2、购买后如果链接失效可联系客服人员完善资源或进行退款办理。
3、资源均来源于网友分享及网络公开发表文件,所有资料仅供学习交流。
4、所收取费用仅用来维系网站运营,性质为用户友情赞助,并非售卖文件费用。
5、如侵犯您的权益,请联系客服人员,我们将会在第一时间进行处理。

评论区

表情

共0条评论
  • 这篇文章还没有收到评论,赶紧来抢沙发吧~
相关推荐