语料规模与常用字词计量研究的关系
基于语料库的计量研究是语言研究的新范式.本研究以常用字/词的提取为切入点,通过语料规模的递增实验,探讨了语料规模与常用字/词计量研究间的关系.实验结果表明:1)在语料规模阈值内,语料规模与高频字词基本呈现一种正相关关系;2)以覆盖率90%为标准提取常用字/词时的语料规模阈值分别为200万和6000万;3)达到语料规模阈值以后,语料规模对高频字词的影响微乎其微.
语料规模、常用字、常用词、计量研究
2014-01-09(万方平台首次上网日期,不代表论文的发表时间)
共9页
566-574