基于卡方统计检验法对文本特征选择的技术实现
该文主要探讨如何从技术上实现基于卡方统计检验的文本特征选择,文中提出采用开源的Lucene索引框架对文本分类语料库进行索引,设计了在特征值计算的过程中如何借助语料库索引快速获取卡方统计检验的相关参数,并使用java多线程技术从整体上优化每个分类下文本特征选择的计算效率。
特征选择、卡方统计、文本分类、JAVA实现
TP311(计算技术、计算机技术)
常州纺织服装职业技术学院应用技术类课题课题编号1400020
2014-11-26(万方平台首次上网日期,不代表论文的发表时间)
共3页
7103-7105