摘要: 深度强化学习是人工智能领域的一个新的研究热点.它以一种通用的形式将深度学习的感知能力与强化学习的决策能力相结合,并能够通过端对端的学习方式实现从原始输入到输出的直接控制.自提出以来,在许多需要感知高维度原始输入数据和决策控制的任务中,深度强化学习方法已经取得了实质性的突破.该文首先阐述了三类主要的深度强化学习方法,包括基于值函数的深度强化学习、基于策略梯度的深度强化学习和基于搜索与监督的深度强化学习;其次对深度强化学习领域的一些前沿研究方向进行了综述,包括分层深度强化学习、多任务迁移深度强化学习、多智能体深度强化学习、基于记忆与推理的深度强化学习等.最后总结了深度强化学习在若干领域的成功应用和未来发展趋势.
摘要:深度强化学习是人工智能领域的一个新的研究热点.它以一种通用的形式将深度学习的感知能力与强化学习的决策能力相结合,并能够通过端对端的学习方式实现从原始输入到输出的直接控制.自提出以来,在许多需要感知高维度原始输入数据和决策控制的任务中,深度强化学习方法已经取得了实质性的突破.该文首先阐述了三类主要的深度强化学习方法,包括基于值函数的深度强化学习、基于策略梯度的深度强化学习和基于搜索与监督的深度强化学习;其次对深度强化学习领域的一些前沿研究方向进行了综述,包括分层深度强化学习、多任务迁移深度强化学习、多智能体深度强化学习、基于记忆与推理的深度强化学习等.最后总结了深度强化学习在若干领域的成功应用和未来发展趋势.
说明:如本页面涉及到版权问题或作者不愿意公开,请联系本站管理员删除!
[1] | 何炎祥 孙松涛 牛菲菲 李飞 . 用于微博情感分析的一种情感语义增强的深度学习模型 [J]. 计算机学报 ,2017,4 |
[2] | 翁文伟 . 静吸复合全身麻醉与靶控输注对老年高血压患者麻醉深度的影响对比研究 [J]. 中国结合医学杂志 ,2018,6 |
[3] | 卢璐 . Narcotrend监测不同麻醉深度对老年肠癌患者术后早期认知功能障碍的影响 [J]. 航空军医 ,2018,4 |
[4] | 徐志军 . 深度烧伤治疗中整形外科修复的应用 [J]. 航空军医 ,2018,4 |
[5] | 伍太贵 . 相同麻醉深度下全麻联合硬膜外阻滞和单纯全麻七氟醚的临床分析 [J]. 名医 ,2016,7 |
[6] | 刘双双 . 海洋桩基平台钢管桩自由站立深度分析与问题探讨 [J]. 海岸工程 ,2017,3 |
[7] | 马培晗 . 麻醉深度指数用于高龄患者全麻期间麻醉深度监测的临床评价 [J]. 航空军医 ,2018,10 |
[8] | 徐琴秀 李雅萱 . 婴幼儿保留灌肠时插管深度的探讨 [J]. 航空军医 ,2018,9 |