Spectrogram

class paddle.audio.features. Spectrogram ( n_fft=512, hop_length=512, win_length=None, window='hann', power=1.0, center=True, pad_mode='reflect', dtype='float32' ) [源代码]

通过给定信号的短时傅里叶变换得到频谱。

参数

  • n_fft (int,可选) - 离散傅里叶变换中频率窗大小,默认 512。

  • hop_length (int,可选) - 帧移,默认 512。

  • win_length (int,可选) - 短时 FFT 的窗长,默认为 None。

  • window (str,可选) - 窗函数名,默认'hann'。

  • power (float,可选) - 幅度谱的指数,默认是1.0。

  • center (bool,可选) - 对输入信号填充,如果 True,那么 t 以 t*hop_length 为中心,如果为 False,则 t 以 t*hop_length 开始,默认是True。

  • pad_mode (str,可选) - 如果 center 是 True,选择填充的方式,默认值是'reflect'。

  • dtype (str,可选) - 输入和窗的数据类型,默认是'float32'。

返回

计算``Spectrogram``的可调用对象.

代码示例

import paddle
from paddle.audio.features import Spectrogram

sample_rate = 16000
wav_duration = 0.5
num_channels = 1
num_frames = sample_rate * wav_duration
wav_data = paddle.linspace(-1.0, 1.0, num_frames) * 0.1
waveform = wav_data.tile([num_channels, 1])

feature_extractor = Spectrogram(n_fft=512, window = 'hann', power = 1.0)
feats = feature_extractor(waveform)