10.3969/j.issn.1000-7024.2014.08.053
基于各向异性热度扩散的主题检测方法
为规避审查,互联网中经常使用同音、形似、谐音等替代真实词汇谈论同一主题,需要有相应的表达、识别和检测机制。一个主题通常包含多个关键词,引入词网,根据相关词汇对主题进行索引。当一个词语被提及时,其所属的主题热度也相应增加,并增加与其相关联词语的出现频率和主题热度。引入各向异性扩散(anisotropic diffusion)方程作为热度扩散标准。实验结果表明,该检测方法所得结果与人工标注结果匹配度较高。
主题检测、词网、各向异性扩散、被动冷却、比较排序
TP391(计算技术、计算机技术)
国家科技支撑计划课题基金项目2012BAH20F01;人工智能四川省重点实验室开放基金项目2014RYY03;四川省科技厅基金项目2014GZX009-1
2014-09-26(万方平台首次上网日期,不代表论文的发表时间)
共5页
2886-2889,2916