面向Web的藏文文本分词策略研究
文章归纳整理了面向Web的藏文文本对分词系统的要求,对比参照其他藏文分词系统的优缺点并借鉴汉语分词系统的一些好的方法,设计开发了一个面向藏文网页的自动分词系统.该系统结合藏语语句特点,首先利用特征词进行了文本分块,然后对语块内文本综合运用统计与词典匹配的方法实现了藏文的自动分词.实验测试结果表明该系统明显提升了Web文本的分词效果.
藏文、特征词、Web、自动分词
TP391.1;TN912.3;H178
教育部人文社会科学研究项目No:13XZJC870001
2015-01-07(万方平台首次上网日期,不代表论文的发表时间)
42-46