10.3321/j.issn:0469-5097.2006.02.006
一种基于词共现图的文档主题词自动抽取方法
主题词抽取是文本自动处理的基础性工作.在对现有主题词抽取方法深入研究的基础上,提出了一种基于词共现图的文档主题词自动抽取方法;该方法以基于词频统计方法为基础,利用在词共现图形成的主题信息以及不同主题间的连接特征信息自动地提取文档中的主题词,旨在找出一些非高频词且又对主题贡献大的词.实验表明了该抽取方法抽取出的主题词更能准确地符合了作者的主题.
自然语言处理、词共现图、主题词、TFIDF
42
TP391(计算技术、计算机技术)
国家自然科学基金70171052,90104030;安徽省教育厅自然科学基金2005kj009zd
2008-05-12(万方平台首次上网日期,不代表论文的发表时间)
共7页
156-162