lu_unpack¶
对 paddle.linalg.lu 返回结果的 LU、pivot 进行展开得到原始的单独矩阵 L、U、P。
从 LU 中获得下三角矩阵 L,上三角矩阵 U。 从序列 pivot 转换得到矩阵 P,其转换过程原理如下伪代码所示:
ones = eye(rows) #eye matrix of rank rows
for i in range(cols):
swap(ones[i], ones[pivots[i]])
return ones
参数¶
x (Tensor) - paddle.linalg.lu 返回结果的 LU 矩阵。
y (Tensor) - paddle.linalg.lu 返回结果的 pivot 序列。
unpack_ludata (bool,可选) - 若为 True,则对输入 x(LU)进行展开得到 L、U,否则。默认 True。
unpack_pivots (bool,可选) - 若为 True,则对输入 y(pivots)序列进行展开,得到转换矩阵 P。默认 True。
name (str,可选) - 具体用法请参见 Name,一般无需设置,默认值为 None。
返回¶
Tensor L,由 LU 展开得到的 L 矩阵,若 unpack_ludata 为 False,则为 None。
Tensor U,由 LU 展开得到的 U 矩阵,若 unpack_ludata 为 False,则为 None。
Tensor P,由序列 pivots 展开得到的旋转矩阵 P,若 unpack_pivots 为 False,则为 None。
代码示例¶
import paddle
x = paddle.to_tensor([[1.0, 2.0], [3.0, 4.0], [5.0, 6.0]]).astype('float64')
lu,p,info = paddle.linalg.lu(x, get_infos=True)
# >>> lu:
# Tensor(shape=[3, 2], dtype=float64, place=CUDAPlace(0), stop_gradient=True,
# [[5. , 6. ],
# [0.20000000, 0.80000000],
# [0.60000000, 0.50000000]])
# >>> p
# Tensor(shape=[2], dtype=int32, place=CUDAPlace(0), stop_gradient=True,
# [3, 3])
# >>> info
# Tensor(shape=[], dtype=int32, place=CUDAPlace(0), stop_gradient=True,
# 0)
P,L,U = paddle.linalg.lu_unpack(lu,p)
# >>> P
# (Tensor(shape=[3, 3], dtype=float64, place=CUDAPlace(0), stop_gradient=True,
# [[0., 1., 0.],
# [0., 0., 1.],
# [1., 0., 0.]]),
# >>> L
# Tensor(shape=[3, 2], dtype=float64, place=CUDAPlace(0), stop_gradient=True,
# [[1. , 0. ],
# [0.20000000, 1. ],
# [0.60000000, 0.50000000]]),
# >>> U
# Tensor(shape=[2, 2], dtype=float64, place=CUDAPlace(0), stop_gradient=True,
# [[5. , 6. ],
# [0. , 0.80000000]]))
# one can verify : X = P @ L @ U ;