10.3969/j.issn.1009-3044.2008.30.007
医药信息文本分类系统中特征选择模块的研究
自动文本分类技术是组织和管理医药信息的一个有效的办法.本文主要针对医药信息的自动文本分类系统展开研究,重点研究如何根据医药领域的特点进行有效的特征选择,提出了使用文档频率DF和互信息MI相结合进行医药特征选择的方法.另外,本文还构建了一个医药信息语料库作为医药信息自动文本分类系统的训练集和测试集,该语料库包含五个类别,600篇文本.实验证明,该方法能够有效提高医药文本分类系统的分类速度和精度.
文本分类、特征选择、医药信息
4
TP391(计算技术、计算机技术)
广东省医学科研基金资助项目B2008088;广东药学院科研基金资助项目2007YGY01
2009-01-06(万方平台首次上网日期,不代表论文的发表时间)
共3页
531-533