DOI：10.13266/j.issn.0252-3116.2020.07.002

面向先秦典籍的知识本体构建技术研究

引用

摘要：

[目的/意义]构建面向典籍文本的语义本体,能够促进典籍文本的挖掘与分析.然而由于典籍文本与现代文本在语法上存在较大差异,给面向典籍的语义本体构建带来了困难.[方法/过程]本文运用自然语言处理技术探讨针对先秦典籍的本体构建方法.以国际上文化遗产领域通用的CIDOC CRM为框架,设计先秦典籍本体模型.针对典籍文本内容的特点及句法特征,将规则抽取与条件随机场方法相结合,提出一套本体实例自动获取技术,并以《左传》为实验语料进行测试.[结果/结论]实验表明,本文所提出的本体实例抽取技术能够较好地提高面向典籍文本的本体构建效率.基于规则的本体实例抽取实验F值在93％左右,基于条件随机场的本体实例抽取最佳特征模板的F值为82.51％.在本体实例获取中,词性信息和位置信息具有重要作用.

关键词：先秦典籍、左传、本体构建、条件随机场、规则匹配

所属期刊栏目：64

分类号：G254(图书馆学、图书馆事业)

资助基金：本文系中央高校基本科研业务费资助项目"基于《汉学引得丛刊》的古文本体研究"项目编号:SKCX2017004

在线出版日期：2020-11-10（万方平台首次上网日期，不代表论文的发表时间）

页数：共7页

页码：13-19

英文信息展示

期刊专题