10.3969/j.issn.1673-629X.2020.05.038
关于常用字覆盖率统计算法的研究
对常用字在教育资源电子文本中的覆盖率、使用率、字频统计算法进行了研究,并根据算法通过计算机语言开发常用字覆盖率统计分析系统.统计分析系统可以对文本中所使用的常用字进行统计分析,即可以统计常用字覆盖率、文本汉字数、常用字字频、常用字使用率等,并根据统计数据以饼形图的方式显示.为了了解常用字在文本中的覆盖率和使用情况,通过常用字覆盖率统计分析系统对一些电子文本进行了统计分析,并得出相应的结果.结果表明常用字在文本中的覆盖率和使用率相当高,即581个常用字在文本中的覆盖率平均在68.9%以上,1000个常用字在文本中的覆盖率平均在81.4%以上,2500个常用字在文本中的覆盖率平均在96%以上,并且常用字在不同统计对象文本中的使用频度也会有所不同.
常用字、统计算法、覆盖率统计、使用率统计、字频统计
30
TP391.1(计算技术、计算机技术)
新疆维吾尔自治区重点实验室开放课题2019D04024
2020-05-28(万方平台首次上网日期,不代表论文的发表时间)
共6页
201-205,210