10.3772/j.issn.1000-0135.2018.01.007
基于非线性规划理论的事件主题词过滤方法
本文提出一种基于非线性规划理论的突发事件主题词自动过滤方法.首先以左右邻接熵为主题短语的边界识别依据,选出更具信息量的短语作为候选主题词,然后通过将候选主题词回溯原始文档集合的方式过滤掉部分噪声词,最后采用基于非线性规划理论的函数,对抽取到的候选主题词按权重进行排序,选定更具突发事件类别表征能力的主题词.在几个类别突发事件语料上与传统的 TF-IDF 算法的对比实验结果说明了本文方法的有效性和实用价值.
突发事件主题词、左右邻接熵、噪声词过滤、非线性规划理论
37
国家科技支撑计划项目"面向科技情报分析的信息服务资源开发与支撑技术研究"2015BAH25F01
2018-03-28(万方平台首次上网日期,不代表论文的发表时间)
共7页
61-67