10.19734/j.issn.1001-3695.2023.02.0052
基于强化学习的1型糖尿病胰岛素给药策略研究
1型糖尿病(T1D)患者需要通过外源性胰岛素的输送将血糖(BG)维持在治疗范围内.目前,已有的几种基于模型预测控制和强化学习(RL)的胰岛素给药算法存在样本效率差、奖励机制过于简单、血糖调控效果不佳等问题.为此提出了一种基于强化学习的带有指导网络的胰岛素给药策略(insulin administration strategy with guided network,IASGN),针对给药策略安全性能和快速性的特点,引入累积情节奖励和分类经验回放方法,按照不同的重要性采样权重增加了精英样本池,并基于精英样本池训练给药指导网络,对策略网络进行动作指导,改进了奖励机制,在FDA批准的UVA/Padova T1D模拟器中验证了该方法的性能.结果显示,该方法TIR(time in range)达到了 98.21%,TBR(time below range)接近于0,CVGA中所有患者均处于A+B区的安全范围,可以使患者血糖长期处于正常范围内,避免了低血糖的风险,在与基准方法对比中也获得了更好的表现.
强化学习、1型糖尿病治疗、胰岛素给药策略、精英样本池、指导网络
40
TP391(计算技术、计算机技术)
国家重点研发计划2018YFB1402800
2023-10-19(万方平台首次上网日期,不代表论文的发表时间)
共5页
2765-2769