10.16337/j.1004-9037.2023.01.015
面向教学评价的课堂视频镜头边界检测新方法
课堂视频镜头边界检测对教学评价具有重要意义.针对教学视频视觉信息变化不明显、镜头边界信息不足、检测结果不利于教学评价等问题,引入注意力机制,提出了基于视觉和文本特征描述学习的课堂视频镜头边界检测方法.首先,提出了层次视觉Transformer模型学习教学评价关注的屏幕、教师和学生等感兴趣区域的视觉特征.其次,提出了层次文本Transformer模型从屏幕和语音文本中学习教学评价关注的文本特征.最后,构建基于二值交叉熵的镜头分类和边界检测损失函数.在数据集CLShots上的实验结果表明,本文方法在准确率、召回率、F1分数和平均交并比等指标比当前先进的教学镜头检测方法SBLV分别提高了 23.3%、22.4%、22%和35.7%,比通用领域深度学习方法TransNet V2分别提高了 13.8%、14.5%、14.3%和 21.3%.
教学评价、课堂视频分割、注意力机制模型、镜头边界检测
38
TP391(计算技术、计算机技术)
教育部供需对接就业育人项目;江苏省教育科学十四五规划课题;江苏高校哲学社会科学研究项目;苏州市图书馆学会重点项目;常熟理工学院高等教育研究项目
2023-04-07(万方平台首次上网日期,不代表论文的发表时间)
共12页
174-185