基于XGBoost算法的水稻基因组6mA位点识别研究
N6-甲基腺嘌呤(6mA)位点在调控真核生物的基因表达中起着至关重要的作用,准确识别6mA位点有助于理解基因组6 mA位点的分布和生物功能.目前,各种实验测定方法应用于识别不同物种体内的6 mA位点,但其太昂贵和耗时.基于此,文中提出了一种基于XGBoost的识别水稻基因组6mA位点模型P6mA-Rice.首先,通过引入序列核苷酸位置特异性及其他相关DNA性质,从7个方面提出了有效的特征提取准则,使其更全面地提取DNA信息;然后,基于XGBoost算法的特征重要性进行了进一步特征筛选,最终获得了特征集合P6mA;最后,在此基础之上,基于所选XGBoost分类算法,成功构建了P6mA-Rice甲基化位点识别模型.其相应的小刀实验结果表明,P6mA-Rice的敏感性为90.55%,特异性为88.48%,相关系数为79.00%,准确率为89.49%.大量实验验证了P6mA-Rice模型的有效性.
N6-甲基腺嘌呤、序列位置特异性、XGBoost、DNA、序列
49
TP391(计算技术、计算机技术)
国家重点研发计划;河北省高教研究与实践项目;河北省高层次人才资助项目
2022-06-22(万方平台首次上网日期,不代表论文的发表时间)
共5页
309-313