10.3969/j.issn.1000-3428.2008.13.020
Web权威信息自动提取技术的研究及应用
WWW为各行各业提供了大量的信息,但如何准确地从这些信息中提取出相关领域的权威信息是目前研究的热点问题之一.该文提出评判网站信息的多因素综合评估模型,该模型对网站的权威值进行合理计算,给出基于表格数据的语法树模型,完成了表格数据的自动提取.通过实例证明,该方法很好地解决了权威信息的准确和自动提取.
数据提取、Web数据挖掘、语法树、多因素综合评估、表格
34
TP311.32(计算技术、计算机技术)
上海高校优秀青年教师科研专项基金
2008-09-08(万方平台首次上网日期,不代表论文的发表时间)
共3页
54-55,66