基于深度强化学习的多域联合干扰规避

Journal of Signal Processing(2022)

引用 0|浏览1
暂无评分
摘要
无线通信系统的信道开放性使其极易受到外部恶意干扰、通信链路质量难以保证,针对以上问题,本文设计了一种基于深度强化学习的多域联合干扰规避决策方法.该方法联合频域、功率域、调制编码域三个域的抗干扰手段进行干扰规避,在考虑系统性能的同时实现可靠通信.首先,将联合智能干扰规避问题建模为一个马尔可夫决策过程(MDP,Markov Decision Process),动作空间包含切换信道、功率控制、改变调制编码方式.然后,采用基于剪裁的近端策略优化算法(PPO-Clip,Proximal Policy Optimization-Clip)求解获得系统的最优联合干扰规避策略.PPO-Clip算法在多回合训练中以小数量样本迭代更新,避免了策略梯度算法中步长难以确定和更新差异过大的问题.最后,分别在扫频干扰、随机扫频干扰和智能阻塞干扰环境下验证了所提算法的有效性和可靠性.
更多
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要