基于马尔可夫决策过程的算法研究
基于马尔可夫决策过程理论,将终端直通选择与有限阶段折扣MDP模型相结合,研究网络吞吐量最优化问题.首先利用MDP对终端直通选择进行建模,再利用有限阶段后向迭代算法给出最优模式选择策略,最后通过大量的仿真实验,对给出的模式选择策略进行评估.结果表明,基于MDP的模式选择方法在最大化吞吐量方面拥有更好的性能,能得出更优的模式选择策略,具有获得更多系统吞吐量的优势.
马尔可夫决策、终端直通、迭代算法
23
TP301(计算技术、计算机技术)
教育部科技发展中心产学研创新基金项目"基于大数据和人工智能的个性化教育关键技术研究";中国轻工业联合会教育工作分会2019年课题"基于人工智能技术的技能创新平台研究;实践";四川工商职业技术学院院级教育教学类课题"'智能+'时代教育人才培养模式的构建和研究"
2021-04-06(万方平台首次上网日期,不代表论文的发表时间)
共4页
8-11