面向中文网络百科的属性和属性值抽取
针对面向中文网络百科条目文章的属性和属性值抽取,提出一种无监督方法.此方法将属性值看做命名实体,利用频繁模式挖掘和关联分析,从文本中抽取类别属性;采用自扩展方法为属性建立触发词表;基于属性触发词和属性值实体标注挖掘属性值抽取模式,利用层次聚类算法获取高质量的模式.在互动百科中采集的数据集上进行实验,结果表明所提方法行之有效.
知识获取、属性抽取、非结构化文本、模式挖掘
50
TP391(计算技术、计算机技术)
国家自然科学基金61170111,61202043,61262058;中国科学院自动化研究所复杂系统管理与控制重点实验室开放课题20110102;中央高校基本科研业务费专项基金SWJTU11ZT08
2017-01-18(万方平台首次上网日期,不代表论文的发表时间)
共7页
41-47