10.3969/j.issn.1000-3428.2015.02.028
结合语境与布朗聚类特征的上下位关系验证
对海量文本语料进行上下位语义关系自动抽取是自然语言处理的重要内容,利用简单模式匹配方法抽取得到候选上下位关系后,对其进行验证过滤是难点问题。为此,分别通过对词汇语境相似度与布朗聚类相似度计算,提出一种结合语境相似度和布朗聚类相似度特征对候选下位词集合进行聚类的上下位关系验证方法。通过对少量已标注训练语料的语境相似度和布朗聚类相似度进行计算,得到验证模型和2种相似度的结合权重系数。该方法无需借助现有的词汇关系词典和知识库,可对上下位关系抽取结果进行有效过滤。在CCF NLP&2012词汇语义关系评测语料上进行实验,结果表明,与模式匹配和上下文比较等方法相比,该方法可使 F 值指标得到明显提升。
上下位关系、语境相似度、布朗聚类相似度、点互信息、模式匹配、聚类验证
TP18(自动化基础理论)
国家自然科学基金资助项目61163039,61163036,61363058;西北师范大学青年教师科研能力提升计划基金资助项目NWNU-LKQN-10-2。
2015-03-25(万方平台首次上网日期,不代表论文的发表时间)
共6页
145-150