sequence_expand¶
序列扩张层(Sequence Expand Layer),根据输入 y
的第 ref_level
层 lod 对输入 x
进行扩展。x
的 lod level 最多为 1,若 x
的 lod level 为 1,则 x
的 lod 大小必须与 y
的第 ref_level
层 lod 大小相等;若 x
的 lod level 为 0,则 x
的第一维大小必须与 y
第 ref_level
层大小相等。x
的秩最少为 2,当 x
的秩大于 2 时,将被当作是一个二维 Tensor 处理。
该 API 的输入 x
可以是 Tensor 或 LodTensor, y
只能是 LodTensor。
范例解释如下:
例 1:
假设两个长度为 2 的序列[a][b]和[c][d],欲将其扩展为 4 个长度为 2 的序列[a][b]、[a][b]、[c][d]、[c][d]。
序列[a][b]扩展 2 次,[c][d]扩展 2 次,扩展所需依据的 lod 为[2, 2],则:
给定输入一维 Tensor x
x.lod = [[2, 2]] #表示两个序列的长度为 2,为了便于理解这里用基于长度 lod 表示
x.data = [[a], [b], [c], [d]]
x.dims = [4, 1]
和输入 y
y.lod = [[2, 2], #第 0 层 lod,指定按该层扩展,表示分别扩展 2 次,为了便于理解这里用基于长度 lod 表示
[3, 3, 1, 1]] #第 1 层 lod,注意,因为指定 ref_level 为 0,所以这一层与运算无关
指定 ref_level = 0,依据 y 的第 0 层 lod 进行扩展,
经过 sequence_expand,输出为 1 级 Tensor out
out.lod = [[0, 2, 4, 6, 8]] #基于偏移的 lod,等价于基于长度的[[2, 2, 2, 2]]
out.data = [[a], [b], [a], [b], [c], [d], [c], [d]]
out.dims = [8, 1]
例 2:
假设有 3 个长度维 1 的序列[a]、[b]、[c],现在要将其扩展为长度是 2、0、3 的序列[a][a]、[c][c][c]。
显然,扩展后的序列 lod 为[2, 0, 3],则:
给定输入一维 Tensor x
x.data = [[a], [b], [c]]
x.dims = [3, 1]
和输入 y
y.lod = [[2, 0, 3]]
默认 ref_level = -1
经过 sequence_expand,输出为 1 级 Tensor out
out.data = [[a], [a], [c], [c], [c]]
out.dims = [5, 1]
参数¶
x (Variable) - 输入变量,维度为 \([M, K]\) ,lod level 至多 1 的二维 Tensor。数据类型支持 int32,int64,float32 或 float64。
y (Variable) - 输入变量,lod level 至少为 1 的 Tensor。数据类型不限。
ref_level (int,可选) - 扩展
x
所依据的y
的 lod 层。默认值-1,表示 lod 的最后一层。name (str,可选) - 具体用法请参见 Name,一般无需设置,默认值为 None。
返回¶
扩展变量,维度为 \([N, K]\) 的 Tensor,N 由输入 x
和 y
的 lod 共同决定。数据类型与输入 x
一致。
代码示例¶
>>> import paddle
>>> from paddle import base
>>> paddle.enable_static()
>>> import numpy as np
>>> x = paddle.static.data(name='x', shape=[4, 1], dtype='float32')
>>> y = paddle.static.data(name='y', shape=[8, 1],
... dtype='float32', lod_level=1)
>>> out = paddle.static.nn.sequence_expand(x=x, y=y, ref_level=0)
>>> exe = paddle.static.Executor(base.CPUPlace())
>>> place = paddle.CPUPlace()
>>> np_data = np.array([[1], [2], [3], [4]]).astype('float32')
>>> x_lod_tensor = base.create_lod_tensor(np_data, [[2, 2]], place)
>>> print(x_lod_tensor)
- lod: {{0, 2, 4}}
- place: Place(cpu)
- shape: [4, 1]
- layout: NCHW
- dtype: float32
- data: [1 2 3 4]
>>> np_data = np.array([[1], [2], [3], [4], [5], [6], [7], [8]]).astype('float32')
>>> y_lod_tensor = base.create_lod_tensor(np_data, [[2, 2], [3,3,1,1]], place)
>>> print(y_lod_tensor)
- lod: {{0, 2, 4}{0, 3, 6, 7, 8}}
- place: Place(cpu)
- shape: [8, 1]
- layout: NCHW
- dtype: float32
- data: [1 2 3 4 5 6 7 8]
>>> out_main = exe.run(base.default_main_program(),
... feed={'x': x_lod_tensor, 'y': y_lod_tensor},
... fetch_list=[out], return_numpy=False)
>>> print(out_main[0])
- lod: {{0, 2, 4, 6, 8}}
- place: Place(cpu)
- shape: [8, 1]
- layout: NCHW
- dtype: float32
- data: [1 2 1 2 3 4 3 4]