10.3969/j.issn.1000-7024.2013.10.048
基于语义与最大匹配度的短文本分类研究
为了解决基于VSM方法在进行短文本分类时存在的严重数据稀疏问题,提出了基于语义与最大匹配度的短文本分类方法.以《知网》为知识源,设计了基于义原距离、义原深度与区域密度的义原相似度计算方法,实现基于词类的词语相似度计算;提出了基于语义与最大匹配度的方法计算短文本相似度,应用KNN算法进行短文本分类.实验结果表明,该方法与基于语义、基于AD_NB等方法相比,正确率、召回率和F值均得到了明显的提高.
短文本分类、义原相似度、词语相似度、语义、最大匹配度、KNN算法
34
TP391.1(计算技术、计算机技术)
国家自然科学基金项目61271304;北京市教委科技发展计划重点项目暨北京市自然科学基金B类重点项目KZ201311232037
2013-11-18(万方平台首次上网日期,不代表论文的发表时间)
共6页
3613-3618