Conv2D¶

class paddle.fluid.dygraph. Conv2D ( num_channels, num_filters, filter_size, stride=1, padding=0, dilation=1, groups=None, param_attr=None, bias_attr=None, use_cudnn=True, act=None, dtype='float32' ) [源代码] ¶

该接口用于构建 Conv2D 类的一个可调用对象，具体用法参照 代码示例 。其将在神经网络中构建一个二维卷积层（Convolution2D Layer），其根据输入、滤波器参数（num_filters、filter_size）、步长（stride）、填充（padding）、膨胀系数（dilation）、组数（groups）参数来计算得到输出特征图。输入和输出是 NCHW 格式，N是批数据大小，C是特征图个数，H是特征图高度，W是特征图宽度。滤波器的维度是 [M, C, H, W] ，M是输出特征图个数，C是输入特征图个数，H是滤波器高度，W是滤波器宽度。如果组数大于1，C等于输入特征图个数除以组数的结果。如果提供了偏移属性和激活函数类型，卷积的结果会和偏移相加，激活函数会作用在最终结果上。详情请参考：卷积。

对每个输入 X ，有等式：

\[Out = \sigma \left ( W * X + b \right )\]

其中：

\(X\) ：输入特征图， NCHW 格式的 Tensor
\(W\) ：滤波器，维度为 [M, C, H, W] 的 Tensor
\(*\) ：卷积操作
\(b\) ：偏移值，2-D Tensor ，维度为 [M,1]
\(\sigma\) ：激活函数
\(Out\) ：输出值， Out 和 X 的维度可能不同

输出维度计算示例

输入：

输入维度： \((N,C_{in},H_{in},W_{in})\)

滤波器维度： \((C_{out},C_{in},H_{f},W_{f})\)
输出：

输出维度： \((N,C_{out},H_{out},W_{out})\)
其中

\[ \begin{align}\begin{aligned}H_{out} = \frac{\left ( H_{in}+2*paddings[0]-\left ( dilations[0]*\left ( H_{f}-1 \right )+1 \right ) \right )}{strides[0]}+1\\W_{out} = \frac{\left ( W_{in}+2*paddings[1]-\left ( dilations[1]*\left ( W_{f}-1 \right )+1 \right ) \right )}{strides[1]}+1\end{aligned}\end{align} \]

参数：

num_channels (int) - 输入图像的通道数。
num_filters (int) - 滤波器的个数，和输出特征图个数相同。
filter_size (int|tuple) - 滤波器大小。如果 filter_size 是一个元组，则必须包含两个整型数，分别表示滤波器高度和宽度。否则，表示滤波器高度和宽度均为 filter_size 。
stride (int|tuple, 可选) - 步长大小。如果 stride 为元组，则必须包含两个整型数，分别表示垂直和水平滑动步长。否则，表示垂直和水平滑动步长均为 stride 。默认值：1。
padding (int|tuple, 可选) - 填充大小。如果 padding 为元组，则必须包含两个整型数，分别表示竖直和水平边界填充大小。否则，表示竖直和水平边界填充大小均为 padding 。默认值：0。
dilation (int|tuple, 可选) - 膨胀系数大小。如果 dialation 为元组，则必须包含两个整型数，分别表示垂直和水平膨胀系数。否则，表示垂直和水平膨胀系数均为 dialation 。默认值：1。
groups (int, 可选) - 二维卷积层的组数。根据Alex Krizhevsky的深度卷积神经网络（CNN）论文中的分组卷积：当group=2，滤波器的前一半仅和输入特征图的前一半连接。滤波器的后一半仅和输入特征图的后一半连接。默认值：1。
param_attr (ParamAttr, 可选) - 指定权重参数属性的对象。默认值为None，表示使用默认的权重参数属性。具体用法请参见 ParamAttr 。
bias_attr (ParamAttr|bool, 可选) - 指定偏置参数属性的对象。默认值为None，表示使用默认的偏置参数属性。具体用法请参见 ParamAttr 。
use_cudnn (bool, 可选) - 是否用cudnn核，只有已安装cudnn库时才有效。默认值：True。
act (str, 可选) - 应用于输出上的激活函数，如tanh、softmax、sigmoid，relu等，支持列表请参考激活函数，默认值：None。
dtype (str, 可选) - 数据类型，可以为"float32"或"float64"。默认值："float32"。

返回：无

抛出异常：

ValueError - 如果 use_cudnn 不是bool值

代码示例

         from paddle.fluid.dygraph.base import to_variable
import paddle.fluid as fluid
from paddle.fluid.dygraph import Conv2D
import numpy as np

data = np.random.uniform(-1, 1, [10, 3, 32, 32]).astype('float32')
with fluid.dygraph.guard():
    conv2d = Conv2D(3, 2, 3)
    data = to_variable(data)
    conv = conv2d(data)

        

属性¶

weight ¶

本层的可学习参数，类型为 Parameter

bias ¶

本层的可学习偏置，类型为 Parameter