DOI：10.3969/j.issn.1000-3428.2015.02.006

一种面向海量中文文本的典型类属关系识别方法

引用

摘要：

传统基于文本的类属关系自动抽取算法只简单记录关系出现的位置、频次等信息，而忽略了大量上下文信息，不能有效辨识典型类属关系。为此，提出一种面向互联网文本典型类属关系的识别方法。通过提取实体概念的语言学特征和上下文语义特征构成实体特征集，基于朴素贝叶斯分类器，计算任意实体属于不同概念的可能性，从而识别典型类属关系。实验结果证明，与基于频率的识别方法相比，该方法能将典型类属关系的识别准确率提高5%以上。

关键词：中文知识库、类属关系、关系抽取、典型性、模式识别、朴素贝叶斯

分类号：TP391(计算技术、计算机技术)

资助基金：国家自然科学基金资助项目61003001,61170006,6117132,61033010。

在线出版日期：2015-03-25（万方平台首次上网日期，不代表论文的发表时间）

页数：共5页

页码：26-30

英文信息展示

期刊专题