10.3969/j.issn.1002-137X.2013.05.049
一种基于双数组Trie的B2B规则串提取方法
针对B2B垂直搜索引擎中提取产品规格信息困难的问题,提出了一种基于双数组Trie(Double-Array Trie)的规则串提取方法.该方法针对B2B系统中“参数名:参数值”字符串的规则特征构建规则串,生成双数组Trie树;并优先处理分支结点最多的子树,来提高存储效率.该方法对搜索文本进行一次扫描就能得到所有规则串;通过在规则中加入约束条件,对候选串进行有效过滤,以提高规则串的提取准确率.实验表明,该方法能够降低传统规则串查找的算法复杂度,查找规则串的时间复杂度是O(n).
双数组Trie、垂直搜索、规则串、B2B系统
40
TP311.12(计算技术、计算机技术)
国家自然科学基金项目61175048,60875029;科技部创新方法工作专项项目2010IM020900
2013-07-11(万方平台首次上网日期,不代表论文的发表时间)
共4页
206-208,223