10.3969/j.issn.1007-757X.2015.10.007
大数据下档案文档图片化去重模型研究
针对达州市档案局数以万计的档案纸质文档需要通过扫描等技术图像化存储的现有情况,提出了一种在大数据下对相同图片文档去重的策略,先把图片文档转换成二进制流并计算其MD5签名,依据签名对图片文档进行去重实现分布式存储,并通过实验对该模型进行模拟验证,得出一种有效的档案图片文档去重模型。
档案文档、图像化、去重、MD5、分布式存储
TP311(计算技术、计算机技术)
国家档案局项目2014-X-65;四川省教育厅项目15ZB0324
2015-11-19(万方平台首次上网日期,不代表论文的发表时间)
共3页
25-26,33