10.3969/j.issn.1671-7449.2002.z2.147
基于内容的网页信息挖掘原理和设计
本文主要研究基于内容的中文网页的特征提取技术,具体介绍了分词词典的建造方法,网页正文、标记信息和超链信息的特征提取.通过对旅游类网页的实验结果显示,本文的方法和应用效果良好.
信息挖掘、特征提取、超链信息
16
TP3(计算技术、计算机技术)
面向21世纪教育振兴行动计划985计划;中国科学院资助项目60003014
2005-12-22(万方平台首次上网日期,不代表论文的发表时间)
共6页
1479-1484