10.3969/j.issn.1000-5463.2001.02.016
通用简易中文文本压缩方法研究
该文把GB2312-80的汉字转换为从0至6767的短整型数,这些短整型数据有一个共同的存储特点:它们的2字节中的高3位(称为冗余位)皆为0. 删除冗余位而重组其余位即可形成压缩文本. 这种压缩方法显然是简单、快捷、容易实现和对GB2312-80汉字是普遍适用的.
编码、文本压缩、LZ算法、位、按位与运算
TP391(计算技术、计算机技术)
2004-01-08(万方平台首次上网日期,不代表论文的发表时间)
共5页
84-88