matmul¶
注解
该 API 从 CUDA 11.0 开始支持。
对输入 x
与输入 y
求稀疏矩阵乘法,x 为稀疏 Tensor, y 可为稀疏 Tensor 或稠密 Tensor。
输入、输出的格式对应关系如下:
注解
x[SparseCsrTensor] @ y[SparseCsrTensor] -> out[SparseCsrTensor]
x[SparseCsrTensor] @ y[DenseTensor] -> out[DenseTensor]
x[SparseCooTensor] @ y[SparseCooTensor] -> out[SparseCooTensor]
x[SparseCooTensor] @ y[DenseTensor] -> out[DenseTensor]
该 API 支持反向传播,x 和 y 必须 >= 2D,不支持自动广播。 x 的 shape 应该为 [*, M, K] , y 的 shape 应该为 [*, K, N] ,其中 * 为 0 或者批维度。
参数¶
x (SparseTensor) - 输入的 Tensor,可以为 Coo 或 Csr 格式。数据类型为 float32、float64。
y (SparseTensor|DenseTensor) - 输入 Tensor,可以为 Coo 或 Csr 格式 或 DenseTensor。数据类型为 float32、float64。
name (str,可选) - 具体用法请参见 Name,一般无需设置,默认值为 None。
返回¶
SparseTensor|DenseTensor: 其 Tensor 类型由 x 和 y 共同决定,数据类型与输入相同。
代码示例¶
# required: gpu
import paddle
# csr @ dense -> dense
crows = [0, 1, 2, 3]
cols = [1, 2, 0]
values = [1., 2., 3.]
csr = paddle.sparse.sparse_csr_tensor(crows, cols, values, [3, 3])
# Tensor(shape=[3, 3], dtype=paddle.float32, place=Place(gpu:0), stop_gradient=True,
# crows=[0, 1, 2, 3],
# cols=[1, 2, 0],
# values=[1., 2., 3.])
dense = paddle.ones([3, 2])
out = paddle.sparse.matmul(csr, dense)
# Tensor(shape=[3, 2], dtype=float32, place=Place(gpu:0), stop_gradient=True,
# [[1., 1.],
# [2., 2.],
# [3., 3.]])
# coo @ dense -> dense
indices = [[0, 1, 2], [1, 2, 0]]
values = [1., 2., 3.]
coo = paddle.sparse.sparse_coo_tensor(indices, values, [3, 3])
# Tensor(shape=[3, 3], dtype=paddle.float32, place=Place(gpu:0), stop_gradient=True,
# indices=[[0, 1, 2],
# [1, 2, 0]],
# values=[1., 2., 3.])
dense = paddle.ones([3, 2])
out = paddle.sparse.matmul(coo, dense)
# Tensor(shape=[3, 2], dtype=float32, place=Place(gpu:0), stop_gradient=True,
# [[1., 1.],
# [2., 2.],
# [3., 3.]])