distribute_fpn_proposals

paddle.vision.ops. distribute_fpn_proposals ( fpn_rois, min_level, max_level, refer_level, refer_scale, pixel_offset=False, rois_num=None, name=None ) [源代码]

在 Feature Pyramid Networks(FPN)模型中,需要依据 proposal 的尺度和参考尺度与级别将所有 proposal 分配到不同的 FPN 级别中。此外,为了恢复 proposals 的顺序,我们返回一个数组,该数组表示当前 proposals 中的原始 RoIs 索引。计算每个 RoI 的 FPN 级别的公式如下:

\[\begin{split}roi\_scale &= \sqrt{BBoxArea(fpn\_roi)}\\ level = floor(&\log(\frac{roi\_scale}{refer\_scale}) + refer\_level)\end{split}\]

其中 BBoxArea 为用来计算每个 RoI 的区域的方法。

参数

  • fpn_rois (Tensor) - 输入的 FPN RoIs。是形状为[N,4]的 2-D Tensor,其中 N 为检测框的个数,数据类型为 float32 或 float64。

  • min_level (int) - 产生 proposal 的最低级别 FPN 层。

  • max_level (int) - 产生 proposal 的最高级别 FPN 层。

  • refer_level (int) - 具有指定比例的 FPN 层的引用级别。

  • refer_scale (int) - 具有指定级别的 FPN 层的引用比例。

  • pixel_offset (bool, 可选)- 是否有像素偏移。如果是 True, 在计算形状大小时时会偏移 1。默认值为 False。

  • rois_num (Tensor, 可选): 每张图所包含的 RoI 数量。是形状为[B]的 1-D Tensor, 数据类型为 int32。其中 B 是图像数量。如果``rois_num`` 不为 None, 将会返回一个形状为[B]的 1-D Tensor, 其中每个元素是每张图在对应层级上的 RoI 数量。默认值为 None。

  • name (str,可选) - 具体用法请参见 Name,一般无需设置,默认值为 None。

返回

  • multi_rois (List) - 长度为(max_level-min_level+1)的列表,其中元素为 Variable,维度为[M, 4]的 2-D LoDTensor,M 为每个级别 proposal 的个数,数据类型为 float32 或 float64。表示每个 FPN 级别包含的 proposals。

  • restore_ind (Tensor) - 维度为[N,1]的 Tensor,N 是总 rois 的数量。数据类型为 int32。它用于恢复 fpn_rois 的顺序。

  • rois_num_per_level (List) - 一个包含 1-D Tensor 的 List。其中每个元素是每张图在对应层级上的 RoI 数量。数据类型为 int32。

代码示例

import paddle

fpn_rois = paddle.rand((10, 4))
rois_num = paddle.to_tensor([3, 1, 4, 2], dtype=paddle.int32)

multi_rois, restore_ind, rois_num_per_level = paddle.vision.ops.distribute_fpn_proposals(
    fpn_rois=fpn_rois,
    min_level=2,
    max_level=5,
    refer_level=4,
    refer_scale=224,
    rois_num=rois_num)