性能提升、成本降低,这是分布式强化学习算法最新研究进展(分布式训练原理有哪些)

AIGC动态欢迎阅读

原标题:性能提升、成本降低,这是分布式

强化学习算法最新研究进展

关键字:策略,环境,作者,分布式,速度

文章来源:机器之心

内容字数:41365字

内容摘要:

机器之心原创

作者:Jiying

编辑:H4O深度强化学习(Deep Reinforcement Learning,DRL)是一种公认的解决连续决策问题的有效技术。为了应对 DRL 的数据低效(data inefficiency)问题,受到分布式机器学习技术的启发,分布式深度强化学习 (distributed deep reinforcement learning,DDRL) 已提出并成功应用于计算机视觉和自然语言处理领域。有观点认为,分布式强化学习是深度强化学习走向大规模应用、解决复杂决策空间和长期规划问题的必经之路。

分布式强化学习是一个综合的研究子领域,需要深度强化学习算法以及分布式系统设计的互相感知和协同。考虑到 DDRL 的巨大进步,我们梳理形成了 DDRL 技术的展历程、挑战和机遇的系列文章。我们在 part 1 部分回顾了经典的 DDRL 框架,在本部分,我们利用三篇论文,具体分析 DDRL 的今生 — 最新研究进展。

1、SRL: Scaling Distributed Reinforcement Learning to Over TenThousand Cores

原文链接:性能提升、成本降低,这是分布式强化学习算法最新研究进展

联系作者

文章来源:机器之心

作者微信:almosthuman2014

作者简介:专业的人工智能媒体和产业服务平台

0
分享到:
没有账号? 忘记密码?