10.3969/j.issn.1009-3044.2009.25.052
中文科技论文文本分类方法研究
随着人们对科学技术和社会发展的日益重视,学术领域呈现多元化、信息化、现代化的趋势.在这种情况下,研究者们比以往任何时候都迫切地需要高效、全面、方便的学术信息.因此中文科技论文文本分类研究已经成为信息领域中的一个热门话题.该文针对中文科技论文文本特殊的文体格式和语言风格进行了系统地研究,并提出了基于层次分类模型的文本分类算法.实验表明,随着分类类别粒度的细化,采用新的分类算法的分类器在精确率和召回率方面优势逐渐突出.相对于KNN、NB和SVM分类器更适合于中文科技论文文本的分类要求.
复杂特征结构、权重、层次分类模型、分类算法
5
TP18(自动化基础理论)
2009-11-27(万方平台首次上网日期,不代表论文的发表时间)
共3页
7189-7191