#AI#paper#目标检测 DEtection TRansformer
把目标检测作为直接集合预测问题

object queries:一组固定数量(如100个)的可学习位置嵌入,最后将输出相同数量的预测FFN:同一个共享的FFN(class,box):每个预测包含物体的类别class、边界框box
训练时用二分图匹配预测值和真实值
遍历预测值和真实值,算scipy.optimize.linear_sum_assignment算二分图匹配,得到预测值和真实值的最优匹配。算最优匹配的loss,梯度反向回传。