基于改进DDPG算法的机器人路径规划算法研究

Journal of Nanjing University of Science and Technology(2021)

Cited 5|Views3
No score
Abstract
为解决深度强化学习训练时间长、收敛慢的问题,该文针对未知环境下的机器人路径规划,基于深度确定性策略梯度(DDPG)算法,结合人工势场法设计了回报函数.为了符合机器人运动学模型,设计连续的状态和动作空间.采用Python语言,在不同地图下分别使用人工势场法、原始DDP G和该文改进的DDP G算法进行仿真对比实验.改进的DDP G算法通过结合人工势场法,在训练中能够给予模型一定的指引,减少训练的盲目性和随机性,从而大大缩短训练时间,更早得到优化模型.训练1000回合后,原始DDP G算法的成功率为70%,改进DDP G算法的成功率为92%.
More
AI Read Science
Must-Reading Tree
Example
Generate MRT to find the research sequence of this paper
Chat Paper
Summary is being generated by the instructions you defined