10.3969/j.issn.1673-629X.2019.01.025
基于强化学习的分布式智能入侵防御方案设计
协作频谱感知技术能够有效地提高频谱利用率,然而恶意用户的存在将极大地影响整个认知网络的性能,因此恶意用户的检测与防御变得尤为重要.为有效抵御协作频谱感知中的恶意用户及其恶意行为,提出一种强化学习与信誉模型相结合的分布式智能入侵防御方案.在该方案中,认知用户通过不断地观测和学习周围的环境,对于实时变化的网络环境做出最优的选择,选取最优的邻居用户进行合作,以获得最大的回报.当融合中心的判决结果与认知用户的判决结果一致/不一致时,给予相应信誉值的奖励/惩罚,当信誉值低于一定判决门限视为潜在的恶意用户.最终使得智能的恶意用户主动放弃恶意攻击,开始发送正确的感知值,达到一致性融合.仿真结果表明,所提方案能够有效地抵御恶意攻击,极大地提高了网络的健壮性与稳定性.
协作频谱感知、入侵防御、强化学习、信誉模型
29
TP181(自动化基础理论)
国家自然科学基金61603197,61772284;南京邮电大学科研基金NY215104
2019-03-15(万方平台首次上网日期,不代表论文的发表时间)
共6页
118-123