10.19734/j.issn.1001-3695.2017.08.0724
基于LDA和word2vec的英文作文跑题检测
针对目前国内的英语作文辅助批阅系统缺少准确而高效的跑题检测算法的问题,提出了一种结合LDA和word2vec的跑题检测算法.该算法利用LDA模型对文档建模并通过word2vec对文档进行训练,利用得到的文档主题和词语之间的语义关系,对文档中各主题及其特征词计算概率加权和,最终通过设定合理阈值筛选出跑题作文.实验中通过改变文档的主题数而得到不同的F值,确定了最佳主题数.实验结果表明,所提出的方法比基于向量空间模型的方法更具有效性,可以检测到更多的跑题作文,并且准确率较高,F值达到89%以上,实现了作文跑题检测的智能化处理,可以有效地应用在英语作文教学中.
作文跑题检测、向量空间模型、潜在狄利克雷分配、词语间语义关系
36
TP391.1(计算技术、计算机技术)
国家语委“十二五”科研规划2015年度科研项目YB125-178
2019-05-31(万方平台首次上网日期,不代表论文的发表时间)
共5页
415-419