10.16508/j.cnki.11-5866/n.2018.03.012
一种改进空间向量模型的东巴文本表示方法
东巴文本的模型表示是实现东巴文本自动分类的基础.通过分析常用文本表示模型,选择空间向量模型用于东巴文本的表示;通过引入词性因子改进传统的TF-IDF权重计算函数.实验表明,改进后的TF-IDF权重计算函数有助于增强空间向量模型对东巴文本的表示能力,在一定程度上改善了文本分类效果.
东巴文本、文本自动分类、向量空间模型、TF-IDF函数
33
TP391(计算技术、计算机技术)
国家社会科学基金重大项目12&D234
2018-08-14(万方平台首次上网日期,不代表论文的发表时间)
共4页
57-60