10.3969/j.issn.2095-5065.2016.10.016
基于主题网络爬虫思想的 Web数据挖掘算法研究
随着Web页面数据量和信息种类与日俱增,挖掘网页中数据信息的关联性以便产生用户感兴趣的结果越来越难。本文有效利用主题网络爬虫算法的设计思想,尽可能将纷繁复杂的Web数据按照主题分类整合,极大地提高了页面检索效率,以此为基础采用贝叶斯网络算法,实现Web数据关联规则的挖掘操作。最后通过仿真实验,分析实验结果,凸显网页召回率和查准率的提高,打造Web数据挖掘的智能化与个性化。因此,本选题具有一定的前瞻性和研究意义。
主题网络爬虫、贝叶斯网络算法、数据挖掘、关联规则
TP301.6(计算技术、计算机技术)
教育部“十三五”科研规划重点项目“实践教学网络平台的研究与实施”项目编号EDUZH130004。
2016-11-07(万方平台首次上网日期,不代表论文的发表时间)
共6页
79-84