10.3969/j.issn.1000-3428.2014.07.051
基于关键词的云计算语义文本自适应分类
传统语义文本分类方法难以高效地在云计算环境下进行中文文本快速分类。为解决该问题,提出一个在云计算环境下基于语义关键词提取的分布式中文文本自适应分类算法,在代理端对中文文本关键词进行基于语义的分布式提取,并将提取出的中文关键词传输到中心数据库端进行整合,从而确定文本本身类别。通过理论证明在关键词提取数量足够的情况下,提出的文本分类算法可以在保证中文文本分类效果的前提下,有效降低网络传输的代价,从而提高中文文本分类算法在云计算环境下的性能。实验结果验证了该算法在云计算环境下的可行性以及理论推导的正确性。
云计算、关键词提取、文本分类、语义计算、网络传输代价、中文文本语义
TP393(计算技术、计算机技术)
国家“863”计划基金资助项目2013AA01A211。
2014-08-12(万方平台首次上网日期,不代表论文的发表时间)
共7页
247-253