使用 DataFeeder 传入训练/预测数据

Fluid 提供 DataFeeder 类,将 numpy array 等数据转换为 LoDTensor 类型传入训练/预测网络。

用户创建 DataFeeder 对象的方式为:

import paddle.fluid as fluid

image = fluid.layers.data(name='image', shape=[-1, 3, 224, 224], dtype='float32')
label = fluid.layers.data(name='label', shape=[-1, 1], dtype='int64')
place = fluid.CUDAPlace(0) if fluid.core.is_compiled_with_cuda() else fluid.CPUPlace()
feeder = fluid.DataFeeder(feed_list=[image, label], place=place)

其中,feed_list 参数为变量列表,这些变量由 fluid.layers.data() 创建, place 参数表示应将 Python 端传入的 numpy array 等数据转换为 GPU 端或是 CPU 端的 LoDTensor 。 创建 DataFeeder 对象后,用户可调用其 feed(iterable) 方法将用户传入的 iterable 数据转换为 LoDTensor

iterable 应为 Python List 或 Tuple 类型对象,且 iterable 的每个元素均为长度为 N 的 Python List 或 Tuple 类型对象,其中 N 为创建 DataFeeder 对象时传入的 feed_list 变量个数。

iterable 的具体格式为:

iterable = [
    (image_1, label_1),
    (image_2, label_2),
    ...
    (image_n, label_n)
]

其中,image_ilabel_i 均为 numpy array 类型数据。若传入数据的维度为[1],如 label_i, 则可传入 Python int、float 等类型数据。 image_ilabel_i 的数据类型和维度不必 与 fluid.layers.data() 创建时指定的 dtypeshape 完全一致,DataFeeder 内部 会完成数据类型和维度的转换。若 feed_list 中的变量的 lod_level 不为零,则 Fluid 会将经过维度转换后的 iterable 中每行数据的第 0 维作为返回结果的 LoD

具体使用方法请参见 cn_api_fluid_DataFeeder