10.3969/j.issn.1006-9348.2018.06.083
关于大数据知识库资源信息特征优化检测仿真
对大数据知识库资源信息特征的检测,能够有效提高知识库使用效率.对知识库信息特征的优化检测,需要将样本数据按属性划分为子集,并求出子集的信息熵并对样本进行检测测试.传统方法对知识库资源信息特征数据进行编码,形成初始数据信息群,但忽略了对信息样本进行测试,导致检测精度偏低.提出基于决策树分类的知识库资源信息特征检测方法.对知识库资源信息特征数据建立矩阵并进行矩阵转换处理,将样本数据按属性划分为子集,以子属性的个数为权重系数融入熵值计算,在所有熵值中选择最小的熵值所对应的属性为节点,对其余样本进行检测测试,实现对知识库资源信息特征的检测.实验结果表明,上述方法能够有效减小检测误差,通过熵值大小控制检测中冗余信息含量,对比当前方法有较小的噪声,能够有效地对大数据环境下的知识库资源信息特征进行检测.
知识库资源、信息特征、优化检测
35
TP391.3(计算技术、计算机技术)
2018-08-13(万方平台首次上网日期,不代表论文的发表时间)
共5页
380-383,455