10.3969/j.issn.1002-3208.2013.02.10.
基于文本挖掘的流行病学致病因素的提取
目的 基于文本挖掘技术,设计出能够自动提取流行病学致病因素的系统.方法 该自动信息提取系统由一个文本挖掘引擎子系统和一个基于规则的信息提取子系统构成.首先使用文本挖掘引擎标记出所有的名词短语,并收集该名词短语的语义等信息.然后利用基于规则的文本分类器,标记出流行病学致病因素.结果 为评估本系统,将由流行病学专家人工注解的文本输入该系统,评估发现最好的结果F-measure为64.6%,其精确率和召回率分别为61.0%和68.8%,该结果优于其它相关研究,且其中有些错误仍可避免.结论 基于文本挖掘的方法对从流行病学研究文献中自动提取致病因素信息有很大帮助.
文本挖掘、致病因素、信息提取、流行病学
32
R318.04(医用一般科学)
国家留学基金委公派留学基金2009100906
2013-06-13(万方平台首次上网日期,不代表论文的发表时间)
共5页
160-163,205