基于FASTmrEMMA、最小角回归和随机森林的全基因组选择新算法
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方期刊
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

期刊专题

10.7685/jnau.202004015

基于FASTmrEMMA、最小角回归和随机森林的全基因组选择新算法

引用
[目的]本研究将FASTmrEMMA、最小角回归(least angle regression,LARS)和随机森林(random forest,RF)方法应用于全基因组选择,以提高植物数量性状预测的准确性和效率,为植物遗传和育种提供有益信息.[方法]对拟南芥自然群体的模拟数据和真实数据进行全基因组预测.在模拟数据分析中,设置不同的表型缺失率,以平均绝对误差(mean absolute error,MAE)、均方误差(mean squared error,MSE)、预测模型拟合度和计算时间为指标,比较基于最小角回归和随机森林的两阶段算法(two-stage algorithm based on least angle regression and random forest,TSLRF)、基于随机森林的两阶段变量选择(two-stage stepwise variable selection based on random forest,TSRF)、随机森林和全基因组最佳线性无偏预测(genomic best linear unbiased prediction,GBLUP)4种方法的优劣.在拟南芥真实数据研究中,针对长日照花期(days to flowering under long day,LD)、春化长日照花期(days to flowering under long day with vernalization,LDV)和短日照花期(days to flowering under short day,SD)实施全基因组预测,并利用这些表型预测值与观测值进行全基因组关联分析,以比较上述4种全基因组选择方法的性能.[结果]模拟研究表明:在不同表型缺失率下,TSLRF的全基因组预测准确度和预测模型拟合度均较高;真实数据的TSLRF分析也获得相似的结论,且检测到40个已报道与目标性状显著关联的基因.[结论]TSLRF方法的全基因组预测准确度和模型拟合度较高,计算速度快,为分子育种和优异亲本组合的预测提供理论依据.

FASTmrEMMA、最小角回归、随机森林、多基因效应校正、全基因组选择

44

Q943(植物学)

国家自然科学基金青年基金项目31301229

2021-04-08(万方平台首次上网日期,不代表论文的发表时间)

共7页

366-372

相关文献
评论
暂无封面信息
查看本期封面目录

南京农业大学学报

1000-2030

32-1148/S

44

2021,44(2)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn