网络舆情内容分析中的Web文本语义特征抽取研究
网络舆情内容分析的重点是Web文本的内容处理,而抽取Web文本特征是内容处理的基础.首先利用N-Gram算法进行特征项选择并计算权重,然后利用网络舆情领域本体对原始特征进行抽取转换,得到Web文本的语义特征,利用语义特征向量来表征Web文本,将Web文本的相似度转换为基于领域本体的语义特征相似度,提高了网络舆情内容分析的准确度.实验结果表明该方法达到了理想效果.
网络舆情分析、语义特征、抽取转换
2016-05-09(万方平台首次上网日期,不代表论文的发表时间)
26-31