基于Spark和随机森林的乳腺癌风险预测分析
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方期刊
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

期刊专题

10.3969/j.issn.1673-629X.2019.08.027

基于Spark和随机森林的乳腺癌风险预测分析

引用
现代医疗正在朝着智能健康的方向发展.在此大背景下,为了提高乳腺癌风险的发现及预测效果,文中采用大数据分析技术并基于随机森林模型,应用多个弱分类器,将多个决策树获得的结果进行集成,得到疾病发病概率;并采用管道学习方法来训练模型,基于该模型开展了致病因素分析以及结果预测.同时,通过皮尔逊相关系数和Spearman等级相关系数来进行相关度分析,研究权重较高的影响因子,提高乳腺癌风险的监测和早期预防.实验结果表明,在乳腺癌致病细胞细胞核的相关参数中,Perimeter、Texture和Concave points影响因子对于乳腺癌的致病影响程度较大,更易导致疾病的发生.基于管道训练方法所建立的模型预测精度可达99.04%,精度高、方法可靠.最终的实验研究结果对于乳腺癌风险的发现具有一定程度的参考意义.

ApacheSpark、随机森林、疾病预测、机器学习、智能健康、大数据分析

29

TP311(计算技术、计算机技术)

国家自然科学基金41471329;南京邮电大学国自基金孵化项目NY218084

2019-08-29(万方平台首次上网日期,不代表论文的发表时间)

共5页

142-146

相关文献
评论
暂无封面信息
查看本期封面目录

计算机技术与发展

1673-629X

61-1450/TP

29

2019,29(8)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn