10.3969/j.issn.1003-0077.2010.05.008
班智达藏文标注词典设计
语料库加工是一项庞大的语言工程,其中分词标注是最基础性的工作,而分词标注词典是标注系统的重要组成,词典设计的优劣直接关系着分词标注的速度和效率.在设计国家语委项目<班智达藏文自动标注系统>的基础上,给出了分词标注词典库的结构及词典库索引查询算法.对85万字节藏语实验语料的分词和标注,分词准确率达99%,标注准确率达97%.
藏语语料库、分词、标注、词典、索引
24
TP391(计算技术、计算机技术)
国家语委资助项目MZ05-118;国家社会科学基金资助项目07BYY035,09XYY024
2010-11-09(万方平台首次上网日期,不代表论文的发表时间)
共4页
46-49