10.3969/j.issn.0258-8021.2018.04.003
肿瘤参数属性偏序结构可视化实现乳腺癌诊断
为实现乳腺癌数据规则可视化,提出一种基于Lasso和增量学习结合的、以改进的属性偏序结构图为可视化工具的乳腺癌诊断规则提取方法.采用乳腺癌数据为数据源基础上算法分为4步:首先使用Lasso方法进行特征选择实现降维,在9个特征中选出前4个关联度最大的特征;其次进行基于Gini指数的连续数据粒化,通过增量学习方式动态生成形式背景;再次融合二次Lasso筛选,将维数由17降为3;最后使用新的基于基尼指数和覆盖对象的行列优化方法生成属性偏序结构图可视化规则,提取出规则7条.将数据处理结果与主流分类器对比,结果表明,基于该算法的规则提取实现96.52%的诊断准确率,均高于随机森林(94.25%)、Adaboost(90.00%)、1NN(91.33%)、3NN(90.67%)、支持向量机算法(95.00%).最后采用不同增量比例(10% ~ 90%)数据验证增量学习算法效果,表明顺序学习数据量达到30%时模式已经完备,数据量在20%时准确率已经接近支持向量机算法,证明该方法是一种用于诊断可视化的规则发现的有效手段.
Lasso、增量学习、属性偏序结构图、可视化、乳腺癌诊断
37
R318(医用一般科学)
国家自然科学基金61273019,81373767,61501397,61201111;河北省自然科学基金重点项目F2016203443
2018-09-30(万方平台首次上网日期,不代表论文的发表时间)
共10页
404-413