一种基于词聚类的中文文本主题抽取方法
提出了一种基于词聚类的中文文本主题抽取方法,该方法利用相关度对词的共现进行分析,建立词之间的语义关联,并生成代表某一主题概念的用种子词表示的词类.对于给定文档,先进行特征词抽取,再借助词类生成该文档的主题因子,最后按权重输出主题因子,作为文本的主题.实验结果表明,该方法具有较高的抽准率.
主题抽取、词聚类、种子词、主题因子、信息论、词同现、CHI统计
25
TP181(自动化基础理论)
国家自然科学基金60475022;山西省自然科学基金20041041;山西省留学回国人员科研项目2002004
2005-04-21(万方平台首次上网日期,不代表论文的发表时间)
共3页
754-756