10.3969/j.issn.1000-3428.2010.23.028
基于Bootstrapping的本体标注方法
实现语义Web目标的一个重要前提是利用本体词汇标注Web资源.为此,提出一种基于弱监督(Bootstrapping)的本体标注方法.对给定的本体进行解析,生成规则文件,通过文本分类筛选出领域文档.采用Bootstrapping的方法进行信息标注抽取和本体推理,经过几次循环后,只利用少量的训练文本就能达到较好的标注效果.实验证明,该方法实体识别准确率高,标注效果好.
弱监督、规则、本体、标注
36
TP391(计算技术、计算机技术)
2011-03-14(万方平台首次上网日期,不代表论文的发表时间)
共3页
85-87