RoIAlign¶

class paddle.vision.ops. RoIAlign ( output_size, spatial_scale=1.0 ) [源代码] ¶

构建一个 RoIAlign 类的可调用对象。请参见 roi_align API。

参数¶

output_size (int|Tuple[int, int]) - 池化后输出的尺寸(H, W)，数据类型为 int32。如果 output_size 是单个 int 类型整数，则 H 和 W 都与其相等。

spatial_scale (float，可选) - 空间比例因子，用于将 boxes 中的坐标从其输入尺寸按比例映射到输入特征图的尺寸，默认值 1.0。

形状¶

x: 4-D Tensor，形状为(N, C, H, W)。数据类型为 float32 或 float64。

boxes: 2-D Tensor，形状为(boxes_num, 4)。

boxes_num: 1-D Tensor。数据类型为 int32。

output: 4-D tensor，形状为(RoI 数量，输出通道数，池化后高度，池化后宽度)。输出通道数等于输入通道数/（池化后高度 * 池化后宽度）。

返回¶

Tensor，形状为(num_boxes, channels, pooled_h, pooled_w)。

代码示例¶

          import paddle
from paddle.vision.ops import RoIAlign

data = paddle.rand([1, 256, 32, 32])
boxes = paddle.rand([3, 4])
boxes[:, 2] += boxes[:, 0] + 3
boxes[:, 3] += boxes[:, 1] + 4
boxes_num = paddle.to_tensor([3]).astype('int32')
roi_align = RoIAlign(output_size=(4, 3))
align_out = roi_align(data, boxes, boxes_num)
assert align_out.shape == [3, 256, 4, 3]