10.3969/j.issn.1003-3254.2008.08.015
多文档自动文摘中的特征组合优化
在分析当前多文档自动文摘方法中使用较多的特征基础上,提出了一种特征组合优化模型.该模型选用tf*idf,句子位置及与标题句相似度来判断句子包含信息的重要程度,并加入了句子长度特征解决由tf*idf特征引起的长度偏长的句子占优势的问题,采用这4个特征来判断句子的重要性,并给每个特征指定权重来解决优化问题,实验结果表明特征组合优化模型在多文档自动文摘中的可行性.
tf*idf、句子位置、标题句相似度、句子长度、组合优化
17
TP3;G35
2008-09-23(万方平台首次上网日期,不代表论文的发表时间)
共5页
59-63