基于SVM的中文书目自动分类及应用研究
将文本自动分类技术应用于图书书目的自动分类中,利用ICTCLAS分词系统对书名和摘要信息进行中文分词,为标题和摘要的特征词赋予不同的权重。在构建基于文本特征矩阵的基础上,结合SVM算法对实验语料进行学习和测试。为了验证TFIDF权重对分类结果的影响,还对词频特征矩阵、TFIDF特征矩阵和混合特征矩阵进行测试和对比。实验证明,基于混合特征矩阵的SVM算法具有良好的分类效果。据此,构建基于SVM的书目自动分类系统。
机器学习、支持向量机、自动分类、TFIDF
56
G254.1(图书馆学、图书馆事业)
2012-07-09(万方平台首次上网日期,不代表论文的发表时间)
共6页
114-119