10.3969/j.issn.1003-0077.2021.05.003
基于分布式表示的汉字部件表义能力测量与应用
汉字的表义性是其区别于表音文字的一大特点.部件作为构字单位,同汉字的意义之间有着很大的联系.然而,汉字部件的表义能力究竟如何是学界尚待讨论的课题.针对这一问题,该文从汉字部件入手,提出了融合部件的字词分布式表示模型.该模型在向量内部评测任务上性能获得了一定提升,在汉字理据性测量任务上也与人工打分结果显著相关.基于该模型,进一步提出了部件表义能力的计算方法,对汉字部件的表义能力做了整体评估,并结合部件的构字能力建立了现代汉字部件的等级体系.测量结果显示,现代汉字部件具有一定表义能力,但整体而言表义能力偏低.最后,将测量结果应用于对外汉语教学中,确立了适用于部件教学法的部件范围,并提出了对应的汉字教学顺序方案.
汉字部件、表义能力测量、分布式表示
35
TP391(计算技术、计算机技术)
国家语委科研项目;国家社会科学基金;教育部人文社会科学研究项目
2021-05-27(万方平台首次上网日期,不代表论文的发表时间)
共10页
17-26