10.3969/j.issn.1003-3513.2009.03.007
从社会性标签中进行语义关系抽取——一种元数据生成方法
标签形式的社会性语义越来越占据主导地位,使元数据界在这种新形式的信息内容表达和检索方面面临机遇和挑战.其中,主要的挑战是与标签相关的语境信息的缺失.以Flickr标签为例,对如何利用社会性语义资源来丰富主题元数据进行了实验.实验过程包含4个步骤:收集Flickr标签样本;通过共有信息计算标签间的同现情况;通过Coogle检索结果来追踪标签对的语境信息;用自然语言处理和机器学习技术来抽取标签间的语义关系.本实验能够利用Google搜索结果构建语境库,并且以自然语言处理和机器学习算法对这些语句进行处理.这种新方法对于赋予标签对以一定语义关系有相当高的准确率.也探讨该方法在利用社会性语义丰富的主题元数据方面的意义.
关系抽取、标签、搜索引擎、社会性语义、元数据
G250(图书馆学、图书馆事业)
2009-06-05(万方平台首次上网日期,不代表论文的发表时间)
共8页
38-45