dynamic_decode

paddle.nn.dynamic_decode(decoder, inits=None, max_step_num=None, output_time_major=False, impute_finished=False, is_test=False, return_length=False, **kwargs):

重复执行 decoder.step() 直到 其返回的表示完成状态的 Tensor 中的值全部为 True 或解码步骤达到 max_step_num

decode.initialize() 会在解码循环之前被调用一次。如果 decoder 实现了 finalize 方法,则 decoder.finalize() 在解码循环后将被调用一次。

参数

  • decoder (Decoder) - 解码器的实例。

  • inits (object,可选) - 传递给 decoder.initialize 的参数。默认为 None。

  • max_step_num (int,可选) - 最大步数。如果未提供,解码直到解码过程完成( decode.step() 返回的表示完成状态的 Tensor 中的值全部为 True)。默认为 None。

  • output_time_major (bool,可选) - 指明最终输出(此方法的第一个返回值)中包含的 Tensor 的数据布局。如果为 False,其将使用 batch 优先的数据布局,此时的形状为 \([batch\_size,seq\_len,...]\)。如果为 True,其将使用 time 优先的数据布局,此时的形状为 \([seq\_len,batch\_size,...]\)。默认值为 False。

  • impute_finished (bool,可选) - 若为 True 并且 decoder.tracks_own_finished 为 False,对于当前批次中完成状态为结束的样本,将会拷贝其上一步的状态,而非像未结束的实例那样使用 decode.step() 返回的 next_states 作为新的状态,这保证了返回的最终状态 final_states 是正确的;否则,不会区分是否结束,也没有这个拷贝操作。若 final_states 会被使用,则这里应该设置为 True,这会一定程度上影响速度。默认为 False。

  • is_test (bool,可选) - 标识是否是预测模式,预测模式下内存占用会更少。默认为 False。

  • return_length (bool,可选) - 标识是否在返回的元组中额外包含一个存放了所有解码序列实际长度的 Tensor。默认为 False。

  • kwargs - 其他命名关键字参数。这些参数将传递给 decoder.step

返回

tuple,若 return_length 为 True,则返回三元组 (final_outputs, final_states, sequence_lengths),否则返回二元组 (final_outputs, final_states)final_outputs, final_states 包含了最终的输出和状态,这两者都是 Tensor 或 Tensor 的嵌套结构。final_outputs 具有与 decoder.step() 返回的 outputs 相同的结构和数据类型,且其中的每个 tensor 都是将所有解码步中与其对应的的输出进行堆叠的结果;如果 decoder 实现了 finalize 方法,这些 tensor 也可能会通过 decoder.finalize() 进行修改。final_states 是最后时间步的状态,和 decoder.initialize() 返回的初始状态具有相同的结构,形状和数据类型。sequence_lengths 是 int64 类型的 tensor,和 decoder.initialize() 返回的 finished 具有相同的形状,其保存了所有解码序列实际长度。

代码示例

import numpy as np
import paddle
from paddle.nn import BeamSearchDecoder, dynamic_decode
from paddle.nn import GRUCell, Linear, Embedding
trg_embeder = Embedding(100, 32)
output_layer = Linear(32, 32)
decoder_cell = GRUCell(input_size=32, hidden_size=32)
decoder = BeamSearchDecoder(decoder_cell,
                            start_token=0,
                            end_token=1,
                            beam_size=4,
                            embedding_fn=trg_embeder,
                            output_fn=output_layer)
encoder_output = paddle.ones((4, 8, 32), dtype=paddle.get_default_dtype())
outputs = dynamic_decode(decoder=decoder,
                        inits=decoder_cell.get_initial_states(encoder_output),
                        max_step_num=10)