10.3969/j.issn.1672-9722.2015.10.003
基于词共现网络的海量文本分析与热点话题发现
在语言学领域,词与词之间的关系具有很强的规则性,基于词共现网络的文本表示可以最大程度捕捉文本结构信息,揭示其内在的组织原则与语言学规律。论文以取自凤凰网环球军事、新浪网中国军事、中华网中国军事的海量军事语料为研究对象,构建军事领域词共现网络,通过词频统计、结点度分布分析以及命名实体抽取,揭示其小世界特性和无标度特性,实现海量文本的热点话题发现。实验结果显示了相关方法的有效性。
词共现网络、小世界特性、无标度特性、热点话题发现
TP3;TP1
国家自然科学基金编号60974086资助。
2015-11-25(万方平台首次上网日期,不代表论文的发表时间)
共7页
1729-1735