10.3969/j.issn.1000-1565.2014.03.017
基于主题本体扩展特征的短文本分类
短文本具有不同于普通文本的独有特点,例如文本长度较短,特征选择分散不一,这使得短文本文类需要处理这些特殊的问题.本文使用了基于主题本体的特征扩展方法,考虑了特征之间的语义关联,达到了较好的分类性能.同时,通过GC(扩展能力)算法使用了案例维护学习,在K-近邻算法中减少样例个数,从而可以提高搜索近邻样例的效率.数值型实验证明了这种学习算法的有效性.
短文本分类、主题本体、案例维护
34
TP181(自动化基础理论)
国家自然科学基金资助项目60903088;河北省自然科学基金资助项目F2013201064, A2010000188;河北大学自然科学研究计划青年基金资助项目2010Q23;河北省软科学研究计划项目14450318D
2014-06-17(万方平台首次上网日期,不代表论文的发表时间)
共5页
307-311