sequence_expand

paddle.static.nn. sequence_expand ( x, y, ref_level=- 1, name=None ) [源代码]

序列扩张层(Sequence Expand Layer),根据输入 y 的第 ref_level 层 lod 对输入 x 进行扩展。x 的 lod level 最多为 1,若 x 的 lod level 为 1,则 x 的 lod 大小必须与 y 的第 ref_level 层 lod 大小相等;若 x 的 lod level 为 0,则 x 的第一维大小必须与 yref_level 层大小相等。x 的秩最少为 2,当 x 的秩大于 2 时,将被当作是一个二维张量处理。

该 API 的输入 x 可以是 Tensor 或 LodTensor, y 只能是 LodTensor。

范例解释如下:

例 1:
假设两个长度为 2 的序列[a][b]和[c][d],欲将其扩展为 4 个长度为 2 的序列[a][b]、[a][b]、[c][d]、[c][d]。
序列[a][b]扩展 2 次,[c][d]扩展 2 次,扩展所需依据的 lod 为[2, 2],则:
给定输入一维 LoDTensor x
  x.lod  = [[2,        2]]    #表示两个序列的长度为 2,为了便于理解这里用基于长度 lod 表示
  x.data = [[a], [b], [c], [d]]
  x.dims = [4, 1]
和输入 y
  y.lod = [[2,    2],     #第 0 层 lod,指定按该层扩展,表示分别扩展 2 次,为了便于理解这里用基于长度 lod 表示
           [3, 3, 1, 1]]  #第 1 层 lod,注意,因为指定 ref_level 为 0,所以这一层与运算无关
指定 ref_level = 0,依据 y 的第 0 层 lod 进行扩展,

经过 sequence_expand,输出为 1 级 LoDTensor out
  out.lod =  [[0,        2,        4,        6,      8]]  #基于偏移的 lod,等价于基于长度的[[2, 2, 2, 2]]
  out.data = [[a], [b], [a], [b], [c], [d], [c], [d]]
  out.dims = [8, 1]
例 2:
假设有 3 个长度维 1 的序列[a]、[b]、[c],现在要将其扩展为长度是 2、0、3 的序列[a][a]、[c][c][c]。
显然,扩展后的序列 lod 为[2, 0, 3],则:
给定输入一维 LoDTensor x
  x.data = [[a], [b], [c]]
  x.dims = [3, 1]
和输入 y
  y.lod = [[2, 0, 3]]
默认 ref_level = -1

经过 sequence_expand,输出为 1 级 LoDTensor out
  out.data = [[a], [a], [c], [c], [c]]
  out.dims = [5, 1]

参数

  • x (Variable) - 输入变量,维度为 \([M, K]\) ,lod level 至多 1 的二维 Tensor 或 LoDTensor。数据类型支持 int32,int64,float32 或 float64。

  • y (Variable) - 输入变量,lod level 至少为 1 的 LoDTensor。数据类型不限。

  • ref_level (int,可选) - 扩展 x 所依据的 y 的 lod 层。默认值-1,表示 lod 的最后一层。

  • name (str,可选) - 具体用法请参见 Name,一般无需设置,默认值为 None。

返回

扩展变量,维度为 \([N, K]\) 的 LoDTensor,N 由输入 xy 的 lod 共同决定。数据类型与输入 x 一致。

代码示例

import paddle
from paddle import fluid
paddle.enable_static()
import numpy as np

x = paddle.static.data(name='x', shape=[4, 1], dtype='float32')
y = paddle.static.data(name='y', shape=[8, 1],
            dtype='float32', lod_level=1)
out = paddle.static.nn.sequence_expand(x=x, y=y, ref_level=0)

exe = paddle.static.Executor(fluid.CPUPlace())
place = paddle.CPUPlace()

np_data = np.array([[1], [2], [3], [4]]).astype('float32')
x_lod_tensor = fluid.create_lod_tensor(np_data, [[2, 2]], place)
print(x_lod_tensor)
#lod: [[0, 2, 4]]
#    dim: 4, 1
#    layout: NCHW
#    dtype: float
#    data: [1 2 3 4]

np_data = np.array([[1], [2], [3], [4], [5], [6], [7], [8]]).astype('float32')
y_lod_tensor = fluid.create_lod_tensor(np_data, [[2, 2], [3,3,1,1]], place)
print(y_lod_tensor)
#lod: [[0, 2, 4][0, 3, 6, 7, 8]]
#    dim: 8, 1
#    layout: NCHW
#    dtype: int64_t
#    data: [0 0 1 1 1 1 1 0]

out_main = exe.run(fluid.default_main_program(),
                feed={'x': x_lod_tensor, 'y': y_lod_tensor},
                fetch_list=[out], return_numpy=False)
print(out_main[0])
#lod: [[0, 2, 4, 6, 8]]
#    dim: 8, 1
#    layout: NCHW
#    dtype: float
#    data: [1 2 1 2 3 4 3 4]