10.6041/j.issn.1000-1298.2018.09.003
基于半监督主动学习的菊花表型分类研究
鉴于人工和专家分类模式的局限性,基于表型的菊花分类存在效率低下的问题.本文采用基于半监督主动学习技术,在已分类菊花数据的基础上,利用未标号菊花样本数据提供的信息,建立了菊花表型分类模型,提升了分类质量和效率.该模型可以不依赖外界交互,利用未标号样本来自动提升菊花分类的质量.为了训练学习模型,本文收集了菊花的表型特征数据,标注了菊花表型类别,并研究了菊花分类属性特征的编码技术.在此数据集上,采用基于图标号传播的半监督学习技术对未标号的菊花数据进行建模,为了提升半监督分类的有效性,在标号传播的基础上使用主动学习技术,采用熵最大策略来选择难以识别的样本,以改进分类质量.在该数据集上进行了试验验证,并进行了试验对比和分析,试验结果表明,本文方法能够较好地利用未标号菊花样本提升分类的精度,随着标号百分比从6.25%升至23%,识别精度达到0.7以上,标号百分比在81.25%时,平均识别精度和召回率分别达到0.91和0.88.
菊花表型分类、半监督学习、图模型、one-hot编码、主动学习、熵最大化
49
TP391(计算技术、计算机技术)
国家自然科学基金项目61502236;中央高校基本科研业务费专项资金项目KYZ201752、KJQN201651
2018-10-16(万方平台首次上网日期,不代表论文的发表时间)
共8页
27-34