10.3969/j.issn.1001-3695.2003.10.007
一种多值返回的层次化分类方法
随着Internet上信息量的飞速增长,成千上万的网上文档需要分类以方便用户的浏览和获取.因此文档的自动分类工作已经越来越受到重视,一些相应的分类方法也应运而生.但其中很少有涉及到"层次化"的分类领域,且绝大多数方法仅仅返回单个分类结果.文中,我们提出了一种新的文档自动分类方法:MRHC (Multicategory-Returned Algorithm for Hierarchical Classification).该方法着眼于层次化的分类技术,并在适当的情况下为文档返回多个分类结果.该方法中结合了特征削减和增量学习技术以便提高分类性能.最后,为了更加准确、客观的评价分类结果,提出了一种新的评估方法:LEP(Length-of-Error-Path).实验结果表明,提出的分类方法响应时间短,分类准确度高,具有较强的实用性.
分类、层次化分类、多值分类、错误路径长度
20
TP391(计算技术、计算机技术)
国家自然科学基金60073030;国家高技术研究发展计划863计划2001AA110334
2004-02-20(万方平台首次上网日期,不代表论文的发表时间)
共5页
24-28