10.3969/j.issn.1000-3428.2006.03.048
基于向量空间模型的网页文本表示改进算法
介绍了一种新的文本表示算法,应用在网页文本过滤系统中.比起传统的向量空间模型,这种建立在其上的改进算法有更快的过滤速度和更高的过滤精度.该算法直接从过滤模板的特征集中取出词条,只在网页文本出现该词的地方进行精确处理.根据特征项所在的网页标签,赋予不同的权值系数,以准确定义特征词在文中的重要程度,最后建立该网页的文本表示模型.
网页、文本表示、向量空间模型、特征项、权值
32
TP393(计算技术、计算机技术)
2006-03-30(万方平台首次上网日期,不代表论文的发表时间)
共3页
134-135,139