10.3969/j.issn.1000-7024.2007.14.074
Internet网络新闻文本自动摘要的研究
给出了Internet网络新闻中文文本自动摘要的基本思路和基本步骤,讨论了断句、分词算法.针对自动摘要中新闻文本的4种形式特征,提出了一套新的自动摘要方案:首先综合新闻文本的4种形式特征对词汇和句子赋予不同的权值,然后根据权值大小按给定的比例挑选句子,并进行平滑处理,生成文字流畅且具备一定质量的摘要.最后实验分析表明效果较好.
自然语言处理、自动摘要、分词、断句、权重、平滑处理
28
TP319(计算技术、计算机技术)
重庆交通学院高层次人才启动基金2004-2-19
2007-08-20(万方平台首次上网日期,不代表论文的发表时间)
共4页
3518-3520,封3