10.3969/j.issn.1000-1220.2006.05.035
用于Email分类的综合特征表示方法
基于词频的特征表示方法难以准确表示Email的主要内容,从而导致分类的综合性能(F-score)较差.为了解决这个问题,将领域知识引入了Email的特征表示,并在此基础上提出了一种综合领域知识和词频的特征表示方法,用于Email分类.本方法在词频特征的基础上加入人工总结出的领域特征,从而更加准确地表示Email的主要内容,以提高Email分类的平均F-score.基于1080篇Email的分类测试结果表明,与基于词频的特征表示方法和基于领域知识的特征表示方法相比,本方法在针对Email标题实现的Email分类中将平均F-score分别提高了12.28%和23.08%,从而达到69.33%的分类平均F-score.
特征表示、Email、分类
27
TP391(计算技术、计算机技术)
国家高技术研究发展计划863计划90104030;中国科学院资助项目70171052
2006-06-01(万方平台首次上网日期,不代表论文的发表时间)
共3页
930-932