10.3969/j.issn.1000-3428.2008.17.008
基于编辑距离和多种后处理的生物实体名识别
基于编辑距离和多种后处理的生物医学文献实体名识别方法通过"全称编写对识别算法"扩充词典,利用编辑距离算法提高识别召回率.在后处理阶段,使用前后缀词扩展、POS扩展、合并邻近实体及利用上下文线索等方法进一步提高性能.实验结果表明.使用该方法即使利用内部词典也可以获得较好的识别效果.
文本挖掘、实体识别、编辑距离、条件随机域
34
TP391.4(计算技术、计算机技术)
国家自然科学基金资助项目60373095,60673039;国家"863"计划基金资助项目2006AA01Z151
2008-12-15(万方平台首次上网日期,不代表论文的发表时间)
共3页
21-22,25