10.3969/j.issn.1000-3428.2012.15.016
基于语料库的藏语高频词抽取研究
在借鉴汉语基于语料的词抽取技术研究成果的基础上,给出藏语文本预处理方法,并提出一种基于语料库的藏语高频词抽取算法,其中包括藏语文本预处理用噪音字表、紧缩词及其预处理方法和基于语料库的藏语高频词抽取算法.实验结果表明,该算法的准确率达86.22%,召回率达89.79%,F值达87.94%.
信息处理、高频词、藏语抽词、自动分词、语料库、预处理
38
TP391(计算技术、计算机技术)
国家自然科学基金资助项目61163018;国家“973”计划前期研究专项基金资助项目2010CB334708;国家社会科学基金资助项目09XYY024;青海省科技厅应用基础研究计划基金资助项目2011-Z-755,2011-Z-753;青海师范大学科研创新计划基金;青海师范大学中青年科研基金
2012-11-16(万方平台首次上网日期,不代表论文的发表时间)
共3页
56-58