Maxout¶
Maxout 激活层,创建一个可调用对象计算。
假设输入形状为(N, Ci, H, W),输出形状为(N, Co, H, W),则 \(Co=Ci/groups\) 运算公式如下:
\[\begin{split}&out_{si+j} = \max_{k} x_{gsi + sk + j} \\ &g = groups \\ &s = \frac{input.size}{num\_channels} \\ &0 \le i < \frac{num\_channels}{groups} \\ &0 \le j < s \\ &0 \le k < groups\end{split}\]
参数¶
groups (int) - 指定将输入 Tensor 的 channel 通道维度进行分组的数目。输出的通道数量为通道数除以组数。
axis (int,可选) - 指定通道所在维度的索引。当数据格式为 NCHW 时,axis 应该被设置为 1,当数据格式为 NHWC 时,axis 应该被设置为-1 或者 3。默认值为 1。
name (str,可选) - 具体用法请参见 Name,一般无需设置,默认值为 None。
形状¶
input:形状为 \([N, C, H, W]\) 或 \([N, H, W, C]\) 的 4-D Tensor,N 是批尺寸,C 是通道数,H 是特征高度,W 是特征宽度。
output:输出形状为 \([N, Co, H, W]\) 或 \([N, H, W, Co]\) 的 4-D Tensor,其中 \(Co=C/groups\)
代码示例¶
>>> import paddle
>>> paddle.seed(100)
>>> x = paddle.rand([1, 2, 3, 4])
>>> m = paddle.nn.Maxout(groups=2)
>>> out = m(x)
>>> print(out)
Tensor(shape=[1, 1, 3, 4], dtype=float32, place=Place(cpu), stop_gradient=True,
[[[[0.85139430, 0.95717543, 0.43864486, 0.51577556],
[0.84765935, 0.45680618, 0.39412445, 0.72039396],
[0.59444654, 0.78120756, 0.78364515, 0.90572405]]]])