Normal

class paddle.distribution. Normal ( loc, scale, name=None ) [源代码]

正态分布

数学公式:

pdf(x;μ,σ)=1Ze0.5(xμ)2σ2Z=(2πσ2)0.5

上面的数学公式中:

loc=μ : 平均值。 scale=σ : 标准差。 Z: 正态分布常量。

参数

  • loc (int|float|list|numpy.ndarray|Tensor) - 正态分布平均值。数据类型为int、float、list、numpy.ndarray或Tensor。

  • scale (int|float|list|numpy.ndarray|Tensor) - 正态分布标准差。数据类型为int、float、list、numpy.ndarray或Tensor。

  • name (str,可选) - 操作的名称(可选,默认值为None)。更多信息请参见 Name

代码示例

import paddle
from paddle.distribution import Normal

# Define a single scalar Normal distribution.
dist = Normal(loc=0., scale=3.)
# Define a batch of two scalar valued Normals.
# The first has mean 1 and standard deviation 11, the second 2 and 22.
dist = Normal(loc=[1., 2.], scale=[11., 22.])
# Get 3 samples, returning a 3 x 2 tensor.
dist.sample([3])

# Define a batch of two scalar valued Normals.
# Both have mean 1, but different standard deviations.
dist = Normal(loc=1., scale=[11., 22.])

# Complete example
value_tensor = paddle.to_tensor([0.8], dtype="float32")

normal_a = Normal([0.], [1.])
normal_b = Normal([0.5], [2.])
sample = normal_a.sample([2])
# a random tensor created by normal distribution with shape: [2, 1]
entropy = normal_a.entropy()
# [1.4189385] with shape: [1]
lp = normal_a.log_prob(value_tensor)
# [-1.2389386] with shape: [1]
p = normal_a.probs(value_tensor)
# [0.28969154] with shape: [1]
kl = normal_a.kl_divergence(normal_b)
# [0.34939718] with shape: [1]

方法

sample(shape, seed=0)

生成指定维度的样本。

参数

  • shape (list) - 1维列表,指定生成样本的维度。数据类型为int32。

  • seed (int) - 长整型数。

返回

Tensor,预先设计好维度的Tensor,数据类型为float32。

entropy()

信息熵

数学公式:

entropy(σ)=0.5log(2πeσ2)

上面的数学公式中:

scale=σ : 标准差。

返回

Tensor, 正态分布的信息熵,数据类型为float32。

log_prob(value)

对数概率密度函数

参数

  • value (Tensor) - 输入张量。数据类型为float32或float64。

返回

Tensor,对数概率,数据类型与value相同。

probs(value)

概率密度函数

参数

  • value (Tensor) - 输入张量。数据类型为float32或float64。

返回

Tensor,概率,数据类型与value相同。

kl_divergence(other)

两个正态分布之间的KL散度。

数学公式:

KL_divergence(μ0,σ0;μ1,σ1)=0.5(ratio2+(diffσ1)212lnratio)ratio=σ0σ1diff=μ1μ0

上面的数学公式中:

loc=μ0: 当前正态分布的平均值。 scale=σ0: 当前正态分布的标准差。 loc=μ1: 另一个正态分布的平均值。 scale=σ1: 另一个正态分布的标准差。 ratio: 两个标准差之间的比例。 diff: 两个平均值之间的差值。

参数

  • other (Normal) - Normal的实例。

返回

Tensor,两个正态分布之间的KL散度,数据类型为float32。