10.16353/j.cnki.1000-7490.2021.11.023
多语言UGC环境下MOOC课程笔记自动生成
[目的/意义]多语言环境下,用户基于MOOC平台生成了大量UGC笔记,为了更好地利用MOOC资源,文章提出多语言UGC课程笔记自动生成模型,有助于促进全球优质教育资源的共享及提升教育公平.[方法/过程]首先抓取多语言环境下的UGC笔记和讲稿并进行预处理,其次将多语言UGC笔记归并为双语笔记,接下来对热门和冷门课程的多语言UGC实现自动化子主题簇融合,在此基础上依据加权规则提取最佳单条笔记并确定时间戳,将其按照时间顺序进行排列,进而形成系统、完整的双语课程笔记.[结果/结论]通过实例验证了模型的有效性,其中对于热门课程,准确率和召回率均达到100%,对于冷门课程,准确率为79%,召回率为83%.
多语言;用户生成内容;MOOC;课程笔记;层次聚类
44
本文为国家社会科学基金项目"'互联网+'背景下面向产业链的行业信息服务融合研究"的成果之一,项目编号:16BTQ063
2021-12-08(万方平台首次上网日期,不代表论文的发表时间)
共7页
173-179