一种适用于宽字符集文档的压缩方法
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方专利
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

专利专题

一种适用于宽字符集文档的压缩方法

引用
本发明提供一种适用于宽字符集文档的压缩方法,主要是先对文档的中、英文字符分别进行编码,忽略英文字符中重复的高字元0x00,且利用自订规则,对中文字符重新进行编码,并在每段英文之前及每段中文之前,分别加入不会与文档数据冲突的额外标记,用以区分中、英文字符,以便在后续压缩程序中,依其低字元在前、高字元在后的顺序及出现概率,据以分别进行压缩,本发明的压缩方法可有效减少中、英文字符在HUFFMAN树图中的节点数量,从而大幅提升文档的压缩率。

发明专利

CN99110177.4

1999-07-02

CN1279537

2001-01-10

H03M7/30

英业达集团(西安)电子技术有限公司

陈淮琰;郑建锋

710000陕西省西安市高新技术产业开发区西区F-2B号楼2楼

上海专利商标事务所

陈亮

陕西;61

权利要求书1、一种适用于宽字符集文档的压缩方法,针对宽字符集文档进行压缩,该方法包括下列步骤:(1)首先,统计出宽离符集文档中不同字符的个数;(2)其次,藉所统计出不同中文字符的个数及各该中文字符的出现顺序,依一自订的规则,建立中文字符的码值转换表,对这些中文字符进行重新编码,以降低其HUFFMAN树图中的节点数量;再利用LZSS运算法在处理重复字元的编码上较佳的处理能力,对英文字符进行重新编码,令在每段英文之前及每段中文之前,分别加入一不会与文档数据冲突的额外标记,用以区分中、英文字符,以便在后续对这些英文字符进行压缩时,不压缩其高字元0x00部份;(3)然后,再依各字符出现的次数及低字元在前、高字元在后的顺序,分别建立二个HUFFMAN树图;(4)最后,根据该HUFFMAN树图分别建立中、英文字符的编码对应表,以使文档的中、英文字符依该编码对应表完成编码及压缩程序。
相关文献
评论
法律状态详情>>
2012-09-05专利权的终止
2001-01-10公开
2003-07-23授权
2000-01-19实质审查的生效
2004-01-07专利申请权、专利权的转移(专利权的转移)
相关作者
相关机构