谷歌Chrome浏览器插件
订阅小程序
在清言上使用

基于多智能体强化学习的混合博弈模式下多无人机辅助通信系统设计

Journal of Electronics & Information Technology(2022)

引用 3|浏览8
暂无评分
摘要
空天地一体化通信作为未来6G的发展方向,很好地弥补了当前无线通信覆盖不足的弊端.该文提出一种基于多智能体强化学习(MARL)的多无人机(Multi-UAV)辅助通信算法,在用户与无人机(UAVs)构成的混合博弈模式下求解纳什均衡近似解,解决了动态环境下UAVs轨迹设计、多维资源调度以及用户接入策略联合优化问题.结合马尔可夫博弈概念建模该连续决策过程,以集中训练分布式执行(CTDE)机制,将近端策略优化(PPO)算法扩展到多智能体领域.针对离散与连续共存的动作空间设计了两种策略输出模式,并且结合Beta策略改进实现,最后通过仿真实验验证了算法的有效性.
更多
查看译文
关键词
Multi-Unmanned Aerial Vehicle (Multi-UAV) assisted communications, Multi-Agent Reinforcement Learning (MARL), Hybrid game, Nash equilibrium
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要