10.3969/j.issn.1673-629X.2015.09.044
基于语料库和规则库的石油本体自动构建研究
石油领域文本所蕴含的信息丰富但其数目繁多复杂,现有大多数本体都是通过手工构建的,这种方法难以方便快捷地抽取文本信息,难以构建一个较完善的石油领域本体。为提高本体构建的效率,文中综述了本体的主要概念,分析了本体构建的一般原则和方法。利用文本处理软件对文本进行分词处理,生成特征词集并对其进行缩减,利用Petro-Onto方法实现语料库的构建,提出了基于语料库和规则库区分概念、属性并抽取它们之间关系的方法。该方法能大大提高本体的构建效率,并在一定程度上保证结果本体的质量,达到了本体自动建立的目的。
语料库、规则库、领域本体、本体自动构建
TP391.1(计算技术、计算机技术)
国家科技重大专项2011ZX05023-005-012
2015-10-13(万方平台首次上网日期,不代表论文的发表时间)
共4页
209-212