基于深度学习的网站权威性预测
网站权威性一般是由外部链接来衡量,高质量的外部链接越多,网站的权威性就越高;常用的评价网站权威性的算法有PageRank等,然而该类算法对网站权威性的影响是有选择性的,使得这种方法具有一定的弊端.本文利用深度学习的方法,通过将搜索词和网址映射为向量,计算两个向量之间的相似度来评判在某个搜索词下不同网址的权威性,把计算结果相似度高对应的网站称为在该搜索词下权威性高的网站,从而从另一种角度去衡量网站的权威性.通过对比使用Word2vec和LSTM两种不同的模型实验,在对公开的数据集上的实验结果表明使用这两种模型是有效的,其中LSTM模型比Word2vec模型的效果要好.
网站权威性、Word2vec、LSTM、自然语言处理
27
国家重点研发计划2017YFB0203704
2018-12-05(万方平台首次上网日期,不代表论文的发表时间)
共6页
164-169