10.16249/j.cnki.2096-4617.2022.04.010
贫语言资源条件下藏文分句数据集构建研究
基于深度学习的藏文自动分句研究中构建分句数据集,事关藏文分句模型性能和质量.鉴于现有的藏文自动分句数据稀缺问题,文章通过梳理藏文句法结构,提出了位于句末的谓语动词和谓语形容词,以及终结虚词和离合虚词可充当句尾标识符号的观点,并通过相关语料库构建了谓语形容词词典、谓语动词词典和句尾虚词词典,最终使用句尾词匹对方法成功从语料中切分出了40万条句子,解决了藏文分句数据集建构问题,为基于深度学习的藏文分句研究提供了可靠和较大规模的数据基础.
藏文、句子、藏文垂符、分句数据集
6
TP391.1(计算技术、计算机技术)
国家自然科学基金;国家自然科学基金;西藏大学校级培育基金项目;西藏大学在职攻读博士学位资助项目
2023-01-12(万方平台首次上网日期,不代表论文的发表时间)
共10页
85-94