10.3969/j.issn.1001-0645.2001.04.016
基于变长编码集合扩展的中文文本压缩算法
为了获取压缩中文文本的高压缩比,变长编码集合扩展的中文文本压缩算法依据中文语言文字的特点,以不等长高概率汉字串为单位,定义固定字典集,同时寻求高压缩率的匹配方式进行编码.算法的编码转换过程适应了自然语言中的部分马尔可夫过程,相对于不同文本长度及文体风格压缩比分布均衡.此算法能够获得较高的压缩比.
中文文本、数据压缩、压缩算法、无损压缩
21
TP301.6(计算技术、计算机技术)
2004-01-08(万方平台首次上网日期,不代表论文的发表时间)
共5页
480-484