10.3969/j.issn.1001-6600.2010.03.032
基于扩展语义特征机器学习消歧的基因提及标准化
提出了一种基于扩展语义向量的特征表示方法,利用机器学习的方法来解决基因提及标准化中的消歧问题.首先应用高性能的命名实体识别系统识别文献中的基因提及;其次采用不同的搜索策略生成候选结果;再次以扩展语义信息作为特征用机器学习的方法进行消歧;最后利用Wikipedia构建后过滤器对候选结果进行过滤处理.在Biocreative Ⅱ GN任务测试集上的试验表明,该方法的F值达到了83.2%.
基因提及标准化、基因提及消歧、扩展语义特征、机器学习
28
TP391.1(计算技术、计算机技术)
国家863高科技计划资助项目2006AA01Z151;国家自然科学基金资助项目60973068,60673039;国家社科基金资助项目08BTQ025;教育部留学回国人员科研启动基金;高等学校博士学科点专项科研基金资助课题20090041110002
2010-11-29(万方平台首次上网日期,不代表论文的发表时间)
共4页
144-147