DOI：10.3772/j.issn.1000-0135.2009.02.007

基于统计自然语言处理技术的领域本体半自动构建研究

引用

摘要：

本体的构建是影响语义Web成功与否的重要因素之一.本文借鉴机器学习以及自然语言处理等技术成果尝试半自动构建本体,以专业研究论文为研究语料,采用N-Gram文本表达法从语料中抽取关键概念,计算主题度获取领域概念.利用改进的层次聚类算法对领域概念进行聚类以获取其等级体系,采用句法分析与统计相结合的方法从语料中获取可能的主、谓、宾模式为领域关系提供参考,并以农业史为例,设计开发了一个领域本体半自动构建实验系统,文中重点介绍了本体构建中概念的获取、等级关系、领域关系的构建以及形式化处理等关键技术的实现过程.

关键词：领域本体、半自动构建、概念抽取、等级关系、领域关系主谓宾模式

所属期刊栏目：28

分类号：TP3;G20

资助基金：《中国农业科技遗产数字化保护与利用研究》科技部社会公益专项基金项目子课题2005DIB6J028;南京农业大学青年创新基金Y200727

在线出版日期：2009-05-08（万方平台首次上网日期，不代表论文的发表时间）

页数：共7页

页码：201-207

英文信息展示

期刊专题