DOI：10.3321/j.issn:0469-5097.2008.02.013

面向自动文摘的文本结构划分

引用

摘要：

文本结构划分是自动文摘研究中的一个关键阶段,也是自然语言处理领域的重要课题.本文通过构建段落向量空间模型,提出一种综合考察相邻段落相似度和连续段落平均相似度的意义段划分方法,使文摘内容更加全面,结构更加平衡.实验结果表明,该方法能够较有效地反映文章的内容结构,对有子标题组织和无子标题组织的文章均适用;由于考虑了总起段,使得文本结构划分更加合理,为自动文摘系统的后续工作打下坚实的基础.

关键词：文本结构、自动文摘、向量空间模型、段落相似度、意义段划分

所属期刊栏目：44

分类号：TP391(计算技术、计算机技术)

资助基金：国家自然科学基金60773173;60603093;国家社会科学基金07BYY050;国家重点基础研究发展计划973计划2004CB318102;江苏省社会科学规划项目06JSBYY001;中国博士后科学基金20060400027

在线出版日期：2008-06-24（万方平台首次上网日期，不代表论文的发表时间）

页数：共8页

页码：204-211

英文信息展示

期刊专题