10.11968/tsygb.1003-6938.2015072
融合实用性与科学性的互联网信息分类体系构建
分类体系是信息组织的有效形式,传统文献分类体系难以适用分类对象的转变,实用性不足,已有的网络分类体系则缺乏科学性。构建融合实用性与科学性的互联网信息分类体系,能够有效满足用户信息需求,且是自动文本分类技术研究的基础。文章分别以中图法、新浪门户为例,研究传统文献分类法与网络信息分类法的优缺点,提出互联网信息分类体系的实用性、科学性以及均衡性设计原则,基于三个设计原则构建了互联网信息分类体系。为了验证所构建的分类体系的有效性,通过网络爬虫抓取网易门户以及腾讯网的语料作为实验数据,与复旦语料库的分类体系进行对比实验。实验结果表明,相比于复旦语料库的分类体系,文章所提出的互联网信息分类体系具有更高的实用性,且能更为全面地涵盖各种互联网信息,类目之间交叉度小,各个类目信息量接近,文本分类效果更为理想。
互联网信息、分类体系、中图法、语料库
G2503(图书馆学、图书馆事业)
国家自然科学基金项目“面向文本分类的多学科协同建模理论与实验研究”项目编号71373291研究成果之一。
2015-09-17(万方平台首次上网日期,不代表论文的发表时间)
共8页
118-124,144