多向度计量语体特征下的对外汉语教材可读性自动评估研究
本文采用计量语言学方法获取词语、语义、篇章多向度48个不同语体特征,以广泛采用的六套教材的课文顺序作为可读性难度渐升标准,采用机器学习方面的支持向量机评估对外汉语教材中课文的可读性指标,完成了在大量不同特征模型下的可读性评估精确度的比较分析.本文提出的从广泛采用的教材提取可读性标准的方法解决了为支持向量机标注训练集的难题,即避免了人工标注课文可读性标准的繁重工作;另外本文通过比较在不同特征模型下的评估精确度,完成了特征选择,与前人的研究相比选择的最优特征模型在客观性和精准度上得到了显著提升.
计量语言学;对外汉语教材;支持向量机;可读性评估;特征选择
13
2022-01-20(万方平台首次上网日期,不代表论文的发表时间)
共13页
181-193