#AI#paper#目标检测 DEtection TRansformer

把目标检测作为直接集合预测问题

  • object queries:一组固定数量(如100个)的可学习位置嵌入,最后将输出相同数量的预测
  • FFN:同一个共享的FFN
  • (class,box):每个预测包含物体的类别class、边界框box

训练时用二分图匹配预测值和真实值

遍历预测值和真实值,算,得到cost矩阵。用scipy.optimize.linear_sum_assignment算二分图匹配,得到预测值和真实值的最优匹配。算最优匹配的loss,梯度反向回传。

参考