10.3778/j.issn.1002-8331.2009.05.040
机器可读词典中词汇属性信息的获取
获取概念的属性信息有助于构建概念间的关系,进而改进基于概念的信息检索等应用的性能.研究了如何从机器可读词典中获取释义项的属性信息并实现了一个相应的系统DAE(Dictionary Attribute Extractor).系统基于bootstrapping思想,进行模板-元组迭代抽取.在模板的获取中,引入了基于生物信息学多序列比对的方法;模板泛化时,引入词汇语义相似度计算和同义词扩展,提高模板覆盖率.实验中,系统抽取了"功能"、"颜色"和"组成"三种属性,取得了较好的效果.
信息抽取、自举、序列比对、语义相似度
45
TP391(计算技术、计算机技术)
国家自然科学基金资助重大项目the Major Prosram of the National Natural Science Foundation of China under Grant 60496326
2009-04-03(万方平台首次上网日期,不代表论文的发表时间)
共4页
138-140,188