temporal_shift¶
- paddle.nn.functional. temporal_shift ( x, seg_num, shift_ratio=0.25, name=None, data_format='NCHW' ) [源代码] ¶
对输入 X 做时序通道 T 上的位移操作,为 TSM(Temporal Shift Module)中使用的操作。
输入 (X) 的形状应为 [N*T, C, H, W] 或 [N*T, H, W, C],N 是批大小,T 是 seg_num
指定的时间段号,C 是通道号,H 和 W 是特征的高度和宽度。
以 data_format="NCHW" 为例,时间偏移计算如下:
步骤 1:将输入 (X) reshape 为 [N, T, C, H, W]。
步骤 2:填充 0 到第二个 (T) 尺寸的变形结果,填充宽度每边为 1,填充结果的形状为 [N,T+2,C,H,W]。
步骤 3:假设 shift_ratio
为 1/4,切片填充结果如下:
步骤 4:沿第 3(C)维连接三个切片,并将结果重塑为[N*T, C, H, W]。
有关时序移动的详细信息,请参阅文件:Temporal Shift Module
参数¶
x (Tensor) – 时移算符的输入 Tensor。维度为 \([N*T,C,H,W]\) 的 4-D Tensor。N 为批量大小,T 为时间段数,C 为信道数,H 为特征高度,W 为特征宽度,数据类型为 float16、float32 或 float64。
seg_num (int) – 时间段编号,这应该是一个正整数。
shift_ratio (float,可选) – 通道的移位比、通道的第一个
shift_ratio
部分沿时间维度移动-1,通道的第二个shift_ratio
部分沿时间维度移动 1,范围须在 [0, 0.5] 内。默认值 0.25name (str,可选) - 具体用法请参见 Name,一般无需设置,默认值为 None。
data_format (str,可选) - 指定输入的数据格式,输出的数据格式将与输入保持一致,可以是 "NCHW" 或 "NHWC"。N 是批尺寸,C 是通道数,H 是特征高度,W 是特征宽度。默认值:"NCHW"。
返回¶
Tensor,时序位移后的输出 Tensor,维度和数据类型与输入 x
一致。
代码示例¶
import paddle
import paddle.nn.functional as F
input = paddle.randn([6, 4, 2, 2])
out = F.temporal_shift(x=input, seg_num=2, shift_ratio=0.2)