affine_grid¶
用于生成仿射变换前后的 feature maps 的坐标映射关系。在视觉应用中,根据得到的映射关系,将输入 feature map 的像素点变换到对应的坐标,就得到了经过仿射变换的 feature map。
参数¶
theta (Tensor) - Shape 为
[batch_size, 2, 3]
或[batch_size, 3, 4]
的 Tensor,表示 batch_size 个2X3
或3X4
的变换矩阵。数据类型支持 float32,float64。out_shape (Tensor | list | tuple) - 类型可以是 1-D Tensor、list 或 tuple。用于表示在仿射变换中的输出的 shape,其格式为
[N, C, H, W]
或[N, C, D, H, W]
,格式[N, C, H, W]
分别表示输出 feature map 的 batch size、channel 数量、高和宽,格式[N, C, D, H, W]
分别表示输出 feature map 的 batch size、channel 数量、深度、高和宽。数据类型支持 int32。align_corners (bool,可选) - 一个可选的 bool 型参数,如果为 True,则将输入和输出 Tensor 的 4(4D) 或 8(5D) 个角落像素的中心对齐,并保留角点像素的值。默认值:True。
name (str,可选) - 具体用法请参见 Name,一般无需设置,默认值为 None。
返回¶
Tensor。Shape 为
[N, H, W, 2]
的 4-D Tensor 或``[N, D, H, W, 3]``的 5-D Tensor,表示仿射变换前后的坐标的映射关系。输出为 4-D Tensor 时,N、H、W 分别为仿射变换中输出 feature map 的 batch size、高和宽,输出为 5D Tensor 时,N、D、H、W 分别为仿射变换中输出 feature map 的 batch size、深度、高和宽。数据类型与theta
一致。
代码示例¶
import paddle
import paddle.nn.functional as F
# theta shape = [1, 2, 3]
theta = paddle.to_tensor([[[-0.7, -0.4, 0.3],
[ 0.6, 0.5, 1.5]]], dtype="float32")
y_t = F.affine_grid(
theta,
[1, 2, 3, 3],
align_corners=False)
print(y_t)
#[[[[ 1.0333333 0.76666665]
# [ 0.76666665 1.0999999 ]
# [ 0.5 1.4333333 ]]
#
# [[ 0.5666667 1.1666666 ]
# [ 0.3 1.5 ]
# [ 0.03333333 1.8333334 ]]
#
# [[ 0.10000002 1.5666667 ]
# [-0.16666666 1.9000001 ]
# [-0.43333334 2.2333333 ]]]]