10.3969/j.issn.1673-8357.2013.05.007
中国科普网站的特征向量研究
在中国,识别科普网站的内容长期以来主要是依靠专家判断来进行。这种主观判断不仅费时费力,效果也并不好。这其中最主要的一个原因是网站内容比较丰富,人工浏览效率低下,在一定的时间只能处理有限的内容,对于整个网站的判断会存在不全面的地方,也具有主观性。对此问题的解决需要提出一个基于人工智能的可以进行快速定量计算的方法。本文提出的科普网站特征向量就是讲网站内容通过计算机进行处理抽象出来的一个向量空间模型,它能比较好的表现网站的文字内容和意思,可以最终实现机器自动判断网站内容是否含有科普成分以及什么性质的科普内容。
科普网站、特征词频、向量空间
N4;TP39;O29
2013-11-26(万方平台首次上网日期,不代表论文的发表时间)
共5页
43-46,88