cross_entropy¶
该OP计算输入input和标签label间的交叉熵,可用于计算硬标签或软标签的交叉熵。
硬标签交叉熵算法:若soft_label = False, label[i1,i2,...,ik] 表示每个样本的硬标签值:
output[i1,i2,...,ik]=−log(input[i1,i2,...,ik,j]),label[i1,i2,...,ik]=j,j!=ignore_index软标签交叉熵算法:若soft_label = True, label[i1,i2,...,ik,j] 表明每个样本对应类别j的软标签值:
output[i1,i2,...,ik]=−∑jlabel[i1,i2,...,ik,j]∗log(input[i1,i2,...,ik,j])
参数¶
input (Tensor) – 维度为 [N1,N2,...,Nk,D] 的多维Tensor,其中最后一维D是类别数目。数据类型为float32或float64。
label (Tensor) – 输入input对应的标签值。若soft_label=False,要求label维度为 [N1,N2,...,Nk] 或 [N1,N2,...,Nk,1],数据类型为int64,且值必须大于等于0且小于D;若soft_label=True,要求label的维度、数据类型与input相同,且每个样本各软标签的总和为1。
soft_label (bool) – 指明label是否为软标签。默认为False,表示label为硬标签;若soft_label=True则表示软标签。
ignore_index (int) – 指定一个忽略的标签值,此标签值不参与计算,负值表示无需忽略任何标签值。仅在soft_label=False时有效。默认值为-100。
返回¶
Tensor,表示交叉熵结果的Tensor,数据类型与input相同。若soft_label=False,则返回值维度与label维度相同;若soft_label=True,则返回值维度为 [N1,N2,...,Nk,1] 。
代码示例¶
import paddle.fluid as fluid
class_num = 7
x = fluid.data(name='x', shape=[None, 3, 10], dtype='float32')
label = fluid.data(name='label', shape=[None, 1], dtype='int64')
predict = fluid.layers.fc(input=x, size=class_num, act='softmax')
cost = fluid.layers.cross_entropy(input=predict, label=label)