Normal¶
正态分布
数学公式:
上面的数学公式中:
\(loc = \mu\):平均值;
\(scale = \sigma\):标准差;
\(Z\):正态分布常量。
参数¶
loc (int|float|list|tuple|numpy.ndarray|Tensor) - 正态分布平均值。数据类型为 float32 或 float64。
scale (int|float|list|tuple|numpy.ndarray|Tensor) - 正态分布标准差。数据类型为 float32 或 float64。
name (str,可选) - 具体用法请参见 Name,一般无需设置,默认值为 None。
代码示例¶
import paddle
from paddle.distribution import Normal
# Define a single scalar Normal distribution.
dist = Normal(loc=0., scale=3.)
# Define a batch of two scalar valued Normals.
# The first has mean 1 and standard deviation 11, the second 2 and 22.
dist = Normal(loc=[1., 2.], scale=[11., 22.])
# Get 3 samples, returning a 3 x 2 tensor.
dist.sample([3])
# Define a batch of two scalar valued Normals.
# Both have mean 1, but different standard deviations.
dist = Normal(loc=1., scale=[11., 22.])
# Complete example
value_tensor = paddle.to_tensor([0.8], dtype="float32")
normal_a = Normal([0.], [1.])
normal_b = Normal([0.5], [2.])
sample = normal_a.sample([2])
# a random tensor created by normal distribution with shape: [2, 1]
entropy = normal_a.entropy()
# [1.4189385] with shape: [1]
lp = normal_a.log_prob(value_tensor)
# [-1.2389386] with shape: [1]
p = normal_a.probs(value_tensor)
# [0.28969154] with shape: [1]
kl = normal_a.kl_divergence(normal_b)
# [0.34939718] with shape: [1]
方法¶
sample(shape, seed=0)¶
生成指定维度的样本。
参数
shape ((Sequence[int], 可选) - 指定生成样本的维度。
seed (int) - 长整型数。
返回
Tensor,预先设计好维度的 Tensor,数据类型为 float32。
rsample(shape)¶
重参数化采样,生成指定维度的样本。
参数
shape ((Sequence[int], 可选) - 指定生成样本的维度。
返回
Tensor,预先设计好维度的 Tensor,数据类型为 float32。
entropy()¶
信息熵
数学公式:
上面的数学公式中:
\(scale = \sigma\):标准差。
返回
Tensor,正态分布的信息熵,数据类型为 float32。
log_prob(value)¶
对数概率密度函数
参数
value (Tensor) - 输入 Tensor。数据类型为 float32 或 float64。
返回
Tensor,对数概率,数据类型与 value
相同。
probs(value)¶
概率密度函数
参数
value (Tensor) - 输入 Tensor。数据类型为 float32 或 float64。
返回
Tensor,概率,数据类型与 value
相同。
kl_divergence(other)¶
两个正态分布之间的 KL 散度。
数学公式:
上面的数学公式中:
\(loc = \mu_0\):当前正态分布的平均值;
\(scale = \sigma_0\):当前正态分布的标准差;
\(loc = \mu_1\):另一个正态分布的平均值;
\(scale = \sigma_1\):另一个正态分布的标准差;
\(ratio\):两个标准差之间的比例;
\(diff\):两个平均值之间的差值。
参数
other (Normal) - Normal 的实例。
返回
Tensor,两个正态分布之间的 KL 散度,数据类型为 float32。