10.6041/j.issn.1000-1298.2018.07.020
基于农业网络信息分类的热词自动提取方法
热词提取对于监控和分析农业舆情具有重要意义,目前已有一定研究基础,但仍存在针对性差等问题,无法满足农业领域不同产业用户群的个性化需求,为此,提出一种基于农业网络信息分类的热词自动提取方法.首先采用多标记分类算法对文本语料进行分类,按分类类别构建语料库,然后采用基于信息熵的方法对每个类别分别提取热词候选词,最后采用基于时间变化的方法进行候选词热度计算,根据候选词热度排序结果得到热词.本文抽取农业网站上的15 354条文本进行实验,结果表明,热词提取准确率达到0.9以上,能够较高质量地提取农业热词,为不同农业用户群体发现和分析产业热点提供帮助.
农业网络信息、农业舆情监测、热词、多标记分类、热度计算
49
TP391(计算技术、计算机技术)
国家高技术研究发展计划863计划项目2013AA102306;“十二五”国家科技支撑计划项目2012BAD35B06
2018-08-30(万方平台首次上网日期,不代表论文的发表时间)
共8页
160-167