基于水质-声音-视觉融合的循环水养殖鱼类摄食强度识别

引用

摘要：

在工厂化循环水养殖中,准确识别鱼类摄食强度是实现精准投喂的前提和关键.水质、视觉、声音等单模态数据均可用于评估摄食强度,但单一模态往往具有片面性,难以完全反映全局特征,存在识别精度低、可移植性差等问题.多模态方法通过融合不同模态的特征,可为摄食强度量化提供新的手段.基于此,为融合鱼类摄食中的"水质-声音-视觉"信息,实现高精度的鱼类摄食强度量化,该研究在多模态Transformer(multimodal transformer,MulT)的基础上,提出一种多模态融合的鱼类摄食强度识别算法Fish-MulT.首先,从输入的水质、声音和视觉数据中提取特征向量;其次,利用多模态转移模块(multimodal transfer module,MMTM)对输入的特征向量进行融合,得到3种融合向量;然后对融合向量添加自适应权重并相加,得到融合模态;最后,利用融合模态将MulT算法中各模态分支的跨模态Transformer(cross-modal transformer)从2个优化为1个.试验结果表明,与MulT算法相比,该研究算法的鱼类摄食强度识别准确率由93.30％提高到95.36％,参数量减少38％.与水质、声音和视觉单模态相比,准确率分别提高68.56、21.65和3.61个百分点.可用于制定精准投喂策略,并为开发智能投喂系统提供技术支持.

关键词：渔业、养殖、循环水、多模态融合、自适应、摄食强度

所属期刊栏目：39

分类号：S24;S951.2;TP391.4(农业电气化与自动化)

资助基金：国家重点研发计划;北京市自然科学基金;北京市农林科学院青年基金项目;广东省重点领域研发计划项目

在线出版日期：2023-08-23（万方平台首次上网日期，不代表论文的发表时间）

页数：共10页

页码：141-150

英文信息展示

期刊专题