基于SAE-LBP的网页分类研究
在网页分类技术中,SVM、BP神经网络和Naive Bayes等传统分类器主要采用了信息增益、互信息和最大熵等模型选取特征.随着深度学习的发展,深层次地选取特征的方法正在被广泛研究.结合稀疏自动编码器(SAE)和LBP神经网络,提出一种基于SAE-LBP的网页分类器.根据网页文本的半结构化特征,改进了文本特征表示的权重计算.针对网页文本的稀疏性,采用SAE对网页文本进行特征选取.还提出一种基于学习率自动调整的LBP神经网络,有效地降低了训练时间.实验表明,相对于传统的BP神经网络,基于SAE-LBP的网页分类器的分类正确率提升了5.19%,时间性能提升了83.86%.
SAE、LBP、网页分类、深度学习、神经网络
37
TP311(计算技术、计算机技术)
安徽省自然科学基金项目1408085MKL06
2016-10-25(万方平台首次上网日期,不代表论文的发表时间)
共5页
738-742