为实现群养生猪在不同场景下 (白天与黑夜, 猪只稀疏与稠密) 的猪只个体准确检测与实时跟踪, 该研究提出 一种联合检测与跟踪 (Joint Detection and Embedding, JDE) 模型。首先利用特征提取模块对输入视频序列提取不同尺度 的图像特征, 产生 3 个预测头, 预测头通过多任务协同学习输出 3 个分支, 分别为分类信息、边界框回归信息和外观信 息。3 种信息在数据关联模块进行处理, 其中分类信息和边界框回归信息输出检测框的位置, 结合外观信息, 通过包含 卡尔曼滤波和匈牙利算法的数据关联算法输出视频序列。试验结果表明, 本文 JDE 模型在公开数据集和自建数据集的总 体检测平均精度均值 (mean Average Precision, mAP) 为 92.9%, 多目标跟踪精度 (Multiple Object Tracking Accuracy, MOTA) 为 83.9%, IDF1 得分为 79.6%, 每秒传输帧数 (Frames Per Second, FPS) 为 73.9 帧/s。在公开数据集中, 对比 目标检测和跟踪模块分离 (Separate Detection and Embedding, SDE) 模型, 本文 JDE 模型在 MOTA 提升 0.5 个百分点的 基础上, FPS 提升 340%, 解决了采用 SDE 模型多目标跟踪实时性不足问题。对比 TransTrack 模型, 本文 JDE 模型的 MOTA 和 IDF1 分别提升 10.4 个百分点和 6.6 个百分点, FPS 提升 324%。实现养殖环境下的群养生猪多目标实时跟踪, 可为大规模生猪养殖的精准管理提供技术支持。 [ABSTRACT FROM AUTHOR]