10.3969/j.issn.1003-5060.2017.04.008
基于Q学习和TD误差的传感器节点任务调度算法
针对现有合作学习算法存在频繁通信、能量消耗过大等问题,应用目标跟踪建立任务模型,文章提出一种基于Q学习和TD误差(Q-learning and TD error,QT)的传感器节点任务调度算法.具体包括将传感器节点任务调度问题映射成Q学习可解决的学习问题,建立邻居节点间的协作机制以及定义延迟回报、状态空间等基本学习元素.在协作机制中,QT使得传感器节点利用个体和群体的TD误差,通过动态改变自身的学习速度来平衡自身利益和群体利益.此外,QT根据Metropolis准则提高节点学习前期的探索概率,优化任务选择.实验结果表明:QT具备根据当前环境进行动态调度任务的能力;相比其他任务调度算法,QT消耗合理的能量使得单位性能提高了17.26%.
无线传感器网络(WSNs)、传感器节点、任务调度、Q学习、TD误差、协作机制
40
TP393(计算技术、计算机技术)
国家自然科学基金资助项目61370088,61502142;国家国际科技合作专项资助项目2014DFB10060
2017-05-31(万方平台首次上网日期,不代表论文的发表时间)
共7页
470-475,521