10.3969/j.issn.1003-0077.2010.05.001
基于语义角色标注的新闻领域复述句识别方法
复述(Paraphrase)句的识别可看作文本蕴含(Text Entailment)识别的一个子问题,传统的解决方法是通过词频或句法上的相似度来判断.即使用相同的文字书写的句子其含义也可能差别很大,而相同句法结构也不能保证意义一致.该文根据新闻语料的特点,提出了一种通过引入深层的语义角色标注来帮助识别新闻领域复述句的方法.该方法通过在语义角色这种结构化的含义表达形式中提取的特征来弥补传统方法的不足:先识别待判断的两个句子中所有谓词的语义角色,然后计算两个句子间对应语义角色的相似度,最后结合传统的句子相似度计算方法来进行相似性计算.实验证明,该文提出的方法能有效地提高复述语句的识别效果.
复述识别、语义角色标注、自然语言处理
24
TP391(计算技术、计算机技术)
国家自然科学基金资助项目60975053
2010-11-09(万方平台首次上网日期,不代表论文的发表时间)
共7页
3-9