一种基于流水线的数据匹配方法和装置
本发明公开一种基于流水线的数据匹配方法和装置,该方法包括:将参与匹配压缩原始源文件分块顺序逐次读入字典存储器,根据匹配压缩的进度适时更新字典存储器中的数据;顺序对字典存储器中连续3个字符进行改进哈希算法运算,根据得到的哈希值预判可能匹配字符串,据此构成可能匹配字符存储串的地址链;同时以地址链中的值为地址,依次从字典存储器中取值并比较后,将最优匹配结果输出。以上3步同时进行,流水线操作,由于读入和哈希计算速度很快,该流水线的数据依赖性很小。
发明专利
CN201410197834.6
2014-05-12
CN103997346A
2014-08-20
H03M7/30(2006.01)I
东南大学
李冰;董乾;刘勇;赵霞;王刚
214135 江苏省无锡市新区菱湖大道99号
江苏永衡昭辉律师事务所 32250
王斌
江苏;32
一种基于流水线的数据匹配方法,其特征在于,包括:随着匹配单元对文件进行匹配压缩操作,字典存储器将相应地循环从参与匹配压缩原始源文件中读入并更新内容,直至整个文件匹配压缩完毕,其中,字典存储器是一组随机存储器,存储着将要被匹配压缩的文件;哈希单元计算当前处理字符段的哈希值,其中,所述当前处理字符段指当前处理的1个字节的(Byte)的字符及随后的2个字节(Byte)的字符,共3个字节(Byte)的字符;并以此哈希值为地址,将当前处理字符在字典存储器中的位置信息为内容,存储到的链头存储器中;根据上述地址中链头随机存储器中内容的情况,对链头存储器、回溯存储器和相关链头匹配先入先出存储器进行维护;匹配比较单元从链头匹配先入先出存储器和回溯存储器中顺序取得可能匹配的字符串索引,并依次使用改进匹配比较方法取值比较,同时维护回溯存储器,直至匹配比较结束。