10.3969/j.issn.1000-3428.2015.02.006
一种面向海量中文文本的典型类属关系识别方法
传统基于文本的类属关系自动抽取算法只简单记录关系出现的位置、频次等信息,而忽略了大量上下文信息,不能有效辨识典型类属关系。为此,提出一种面向互联网文本典型类属关系的识别方法。通过提取实体概念的语言学特征和上下文语义特征构成实体特征集,基于朴素贝叶斯分类器,计算任意实体属于不同概念的可能性,从而识别典型类属关系。实验结果证明,与基于频率的识别方法相比,该方法能将典型类属关系的识别准确率提高5%以上。
中文知识库、类属关系、关系抽取、典型性、模式识别、朴素贝叶斯
TP391(计算技术、计算机技术)
国家自然科学基金资助项目61003001,61170006,6117132,61033010。
2015-03-25(万方平台首次上网日期,不代表论文的发表时间)
共5页
26-30