使用 DataFeeder 传入训练/预测数据¶
Fluid 提供 DataFeeder
类,将 numpy array 等数据转换为 LoDTensor
类型传入训练/预测网络。
用户创建 DataFeeder
对象的方式为:
import paddle.fluid as fluid
image = fluid.layers.data(name='image', shape=[-1, 3, 224, 224], dtype='float32')
label = fluid.layers.data(name='label', shape=[-1, 1], dtype='int64')
place = fluid.CUDAPlace(0) if fluid.core.is_compiled_with_cuda() else fluid.CPUPlace()
feeder = fluid.DataFeeder(feed_list=[image, label], place=place)
其中,feed_list
参数为变量列表,这些变量由 fluid.layers.data()
创建, place
参数表示应将 Python 端传入的 numpy array 等数据转换为 GPU 端或是 CPU 端的 LoDTensor
。 创建 DataFeeder
对象后,用户可调用其 feed(iterable)
方法将用户传入的 iterable
数据转换为 LoDTensor
。
iterable
应为 Python List 或 Tuple 类型对象,且 iterable
的每个元素均为长度为 N 的 Python List 或 Tuple 类型对象,其中 N 为创建 DataFeeder
对象时传入的 feed_list
变量个数。
iterable
的具体格式为:
iterable = [
(image_1, label_1),
(image_2, label_2),
...
(image_n, label_n)
]
其中,image_i
与 label_i
均为 numpy array 类型数据。若传入数据的维度为[1],如 label_i
, 则可传入 Python int、float 等类型数据。 image_i
与 label_i
的数据类型和维度不必 与 fluid.layers.data()
创建时指定的 dtype
和 shape
完全一致,DataFeeder
内部 会完成数据类型和维度的转换。若 feed_list
中的变量的 lod_level
不为零,则 Fluid 会将经过维度转换后的 iterable
中每行数据的第 0 维作为返回结果的 LoD
。
具体使用方法请参见 cn_api_fluid_DataFeeder 。