BCELoss

class paddle.nn. BCELoss ( weight=None, reduction='mean', name=None ) [源代码]

创建一个 BCELoss 的可调用类,用于计算输入 input 和标签 label 之间的二值交叉熵损失值。二值交叉熵损失函数公式如下:

weight 不为空时,公式为:

\[Out = -1 * weight * (label * log(input) + (1 - label) * log(1 - input))\]

weight 为空时,公式为:

\[Out = -1 * (label * log(input) + (1 - label) * log(1 - input))\]

reductionnone 时,直接返回最原始的 Out 结果。

reductionmean 时,最终的输出结果为:

\[Out = MEAN(Out)\]

reductionsum 时,最终的输出结果为:

\[Out = SUM(Out)\]

注解

输入数据 input 一般是 sigmoid 的输出。因为是二分类,所以标签值 label 应该是 0 或者 1。

参数

  • weight (Tensor,可选) - 手动指定每个 batch 二值交叉熵的权重,如果指定的话,维度必须是一个 batch 的数据的维度。数据类型是 float32, float64。默认值是:None。

  • reduction (str,可选) - 指定应用于输出结果的计算方式,可选值有:'none', 'mean', 'sum'。默认为 'mean',计算 BCELoss 的均值;设置为 'sum' 时,计算 BCELoss 的总和;设置为 'none' 时,则返回 bce_loss。

  • name (str,可选) - 具体用法请参见 Name,一般无需设置,默认值为 None。

形状

  • input (Tensor) - \((N, *)\),其中 N 是 batch_size, * 是任意其他维度。输入数据 input 一般是 sigmoid 的输出。数据类型是 float32、float64。

  • label (Tensor) - \((N, *)\),标签 label 的维度、数据类型与输入 input 相同。

  • output (Tensor) - 输出的 Tensor。如果 reduction'none',则输出的维度为 \((N, *)\),与输入 input 的形状相同。如果 reduction'mean''sum',则输出的维度为 \([1]\)

返回

返回计算 BCELoss 的可调用对象。

代码示例

import paddle

input = paddle.to_tensor([0.5, 0.6, 0.7])
label = paddle.to_tensor([1.0, 0.0, 1.0])
bce_loss = paddle.nn.BCELoss()
output = bce_loss(input, label)
print(output)
# Tensor(shape=[1], dtype=float32, place=Place(gpu:0), stop_gradient=True,
#        [0.65537101])