10.3969/j.issn.1000-1565.2007.01.025
网页超链抓取及自动分类技术实现
为网络环境下个性化信息服务系统实现自动建库功能,提出了一种网络蜘蛛程序的技术方案.该方案使用DELPHI集成开发环境提供的TIdhttp组件抓取网页文本,并利用正则表达式和Mshtml组件从中提取超链信息保存到指定数据库,并能对网页文本进行自动的统计分类.
超链抓取、正则表达式、DELPHI
27
TP391(计算技术、计算机技术)
河北省软科学项目05457203D-2
2007-04-17(万方平台首次上网日期,不代表论文的发表时间)
共4页
99-102