10.3969/j.issn.1002-3208.2016.03.05
一种多特征融合的Web医学信息语义关系抽取方法
目的 为给用户提供更为相关、整体和结构化的Web医学信息,提出一种多特征融合的语义关系抽取方法,以解决中文Web医学信息中两两医学实体之间语义关系的抽取.方法 首先在混合句法分析算法的基础上构造包含词项、语义、词性、交互词、实体对距离、实体类别以及最短依赖关系特征的特征向量并结合支持向量机实现.对Web医学信息中师徒关系、擅长关系及从属关系抽取实验,比较在不同句法分析下、不同特征作用及不同机器学习算法下的语义关系抽取效果.结果 从F估计和算法运行时间来看,混合句法分析下效果最佳.随着特征的加入,抽取效果不断提升,最后,对三类语义关系抽取最终获得81.16%、95.94%和86.16%的F估计值.结论 基于多特征融合的语义关系抽取方法对于Web医学信息语义关系的抽取具有很好的效果.
Web医学信息、语义关系抽取、多特征、混合句法分析、支持向量机
35
R318.04;TP391.04(医用一般科学)
2016-08-17(万方平台首次上网日期,不代表论文的发表时间)
共6页
243-248