10.3969/j.issn.1006-9348.2023.06.001
多模态图像描述任务综述
近年来,随着深度学习技术在计算机视觉和自然语言处理领域取得不断成功,越来越多的学者开始致力于推动计算机视觉和自然语言处理的交叉领域——多模态图像描述的研究进展.现对多模态图像描述任务进行了文献综述,从图像描述方法的发展与分类、常用数据集和评价指标三个方面对该领域进行介绍,对不同方法的优缺点进行了总结,并将不同方法的代表模型在相同数据集上的表现进行比对.最后,对图像描述任务当前面临的挑战和未来发展方向进行展望.
多模态、自然语言处理、图像描述
40
TP391.9(计算技术、计算机技术)
2023-08-02(万方平台首次上网日期,不代表论文的发表时间)
共8页
1-8