DOI：10.3969/j.issn.1003-6059.2007.06.017

一种基于复杂网络特征的中文文档关键词抽取算法

引用

摘要：

关键词抽取是自然语言理解领域中的重要技术之一.本文研究汉语语言所组成的自然语言网络中的复杂网络特性,并根据语言网络中的"小世界"特性和近两年复杂网络研究中部分新的理论成果,提出基于复杂网络特征的中文文档关键词抽取算法.该算法根据文档语言网络中单词结点的复杂网络特征值进行关键词抽取.实验结果表明,本文算法抽取关键词所获得的平均准确率要高于TFIDF关键词抽取算法所获得的平均准确率.

关键词：复杂网络、语言网络、关键词抽取

所属期刊栏目：20

分类号：TP181(自动化基础理论)

资助基金：国家自然科学基金70171052;安徽省自然科学基金2004kj011

在线出版日期：2009-08-19（万方平台首次上网日期，不代表论文的发表时间）

页数：共5页

页码：827-831

英文信息展示

期刊专题