基于拍卖多智能体深度确定性策略梯度的多无人车分散策略研究

GUO Hongda,LOU Jingtao,YANG Zhenzhen,XU Youchun

Journal of Electronics & Information Technology（2023）

Cited 0|Views3

No score

Abstract

多无人车(multi-UGV)分散在军事作战任务中应用非常广泛，现有方法较为复杂，规划时间较长，且适用性不强。针对此问题，该文提出了一种基于拍卖多智能体深度确定性策略梯度(AU-MADDPG)算法的多无人车分散策略。在单无人车模型的基础上，建立基于深度强化学习的多无人车分散模型。对MADDPG结构进行优化，采用拍卖算法计算总路径最短时各无人车所对应的分散点，降低分散点分配的随机性，结合MADDPG算法规划路径，提高训练效率及运行效率；优化奖励函数，考虑训练过程中及结束两个阶段，全面考虑约束，将多约束问题转化为奖励函数设计问题，实现奖励函数最大化。仿真结果表明：与传统MADDPG算法相比，所提算法在训练时间上缩短了3.96%，路径总长度减少14.50%，解决分散问题时更为有效，可作为此类问题的通用解决方案。

Translated text

Key words

Path planning,Deep reinforcement learning,Multi-UGVs,Dispersion strategy,Auction algorithm

AI Read Science

Must-Reading Tree

Example

Generate MRT to find the research sequence of this paper

Chat Paper

Summary is being generated by the instructions you defined