10.13193/j.issn.1673-7717.2014.10.008
基于条件随机场的中医术语抽取方法及其应用探析
中医文献有种类繁多,数量庞大,记录随意,术语表达方式独特等的特点,为知识的获取带来困难.信息抽取技术可以利用计算机对文本信息进行针对性抽取,以结构化的形式将结果储存到数据库中,这种技术可以帮助医学研究者从海量信息中高效获取所需知识.命名实体识别是信息抽取准确与否的关键,对目前常用的几种识别方法进行分析,认为基于统计的方法更适用于中医文献的研究,并选定条件随机场算法,结合中医术语的特点,对该方法及步骤进行了详细阐述.同时,举例介绍了信息抽取技术在中医结构化电子病历及中医专业领域搜索引擎建立中的辅助作用,为其在中医领域的应用提供更广阔的参考思路.
中医术语、信息抽取、条件随机场
32
R22(中医基础理论)
国家自然科学基金项目81273876,81072897;中国中医科学院第五批自主选题项目Z0193;教育部博士点基金项目2011110001;北京中医药大学创新团队项目0100603003
2014-11-17(万方平台首次上网日期,不代表论文的发表时间)
2334-2337