10.3969/j.issn.2095-2163.2024.01.011
基于多模态相似融合的新闻视频故事分割算法
新闻视频数量的不断增加,为准确分割用户感兴趣的新闻视频,本文提出了一种基于多模态相似融合的新闻视频故事分割算法.首先,通过选定视频切割点获取候选新闻故事单元边界,将视频分成音频流和视频流;其次,选择静音区间为音频候选切分点,主持人镜头帧和主题字幕帧作为视频候选切分点,根据候选切分点获得新闻故事基本单元,利用语义相似性分析各单元内容进行合并或独立分离,得到最终新闻故事;最后,采用人脸识别、YOLOv5来进行主题字幕检测、语义相似性合并或独立新闻故事基本单元,使得新闻故事边界划分更为准确.该新闻视频故事分割算法在《新闻联播》视频中查全率和查准率分别达到了97.17%和98.19%,为新闻视频导航、检索等应用提供辅助准备.
新闻故事基本单元、主题字幕、人脸识别、YOLOv5、语义相似性
14
TP399(计算技术、计算机技术)
2024-01-31(万方平台首次上网日期,不代表论文的发表时间)
共7页
70-75,84