中文百科概念术语服务平台SinoPedia的构建研究
随着“数据的网络”的兴起,万维网的内容已不再是纯粹的文本,而是表达和模拟多种事物及事件之间相互关系的实体集合,其中实体名称、属性及取值词表的规范十分重要.国外已形成覆盖广泛的“关联开放数据(LOD)”服务.中文概念术语的缺乏已严重阻碍中文知识图谱和中文领域本体的标准化和推广应用.本文提出的SinoPedia平台采用RDF三元组对目前公共领域的百科概念术语赋予唯一的URI进行资源的持久化,并通过S000PA模块提供检索服务.同时,自建的资源词条已与DBPedia、WikiData、上海图书馆人名规范档等多个开放资源做了实体关联.除检索服务外,SinoPedia还提供了关联数据发布服务,可以充当关联数据发布中心(Hub).通过扩展LODVIEW系统为不同关联数据站点(SPARQL Endpoint)提供统一的关联数据发布和内容协商服务.此外.SinoPedia集成了LODLIVE系统,能够实现不同数据集之间关联数据的发现与融合.目前SinoPedia包括了554万条三元组数据,并提供API接口和SPARQL Endpoint两种数据调用方式,下一步将申请接入LOD云图.SinoPedia将来可以作为数字人文领域的数据链接中心,推动数字人文研究的快速发展.
SinoPedia、关联数据、知识图谱、数字人文、知识发现
G250.2;TP393(图书馆学、图书馆事业)
国家社会科学基金重大项目“面向大数据的数字图书馆移动视觉搜索机制及应用研究”15ZDB126的研究成果之一
2018-08-24(万方平台首次上网日期,不代表论文的发表时间)
共15页
4-18