10.16208/j.issn1000-7024.2018.04.022
基于多谓词语义框架的长短语文本相似度计算
已有的文本相似度计算方法处理长短语时只考虑比较其核心词部分,但核心词的修饰词也会对语义造成一定影响,导致文本相似度计算结果不够准确.为此提出基于多谓词语义框架的长短语文本相似度计算,将文本内容进行多谓词语义框架填充,利用依存句法分析法将长短语构建成短语树,采用层次分析法确定树层权值,结合不同层次的结点相似度得出长短语相似度.对句子、短篇和长篇文本相似度计算的实验分析结果表明,该方法达到了较高准确性,且准确性随文本数量增加而提高.
文本相似度、语义框架、多谓词、依存句法分析、层次分析
39
TP391(计算技术、计算机技术)
北京市教委科技创新服务能力建设基金项目pxm2017-014212-000002
2018-06-08(万方平台首次上网日期,不代表论文的发表时间)
共8页
1022-1028,1052