Subset¶
用于构造一个数据集级的数据子数据集。
给定原数据集合的指标数组,可以以此数组构造原数据集合的子数据集合。
参数¶
datasets (Dataset) - 原数据集。
indices (sequence) - 用于提取子集的原数据集合指标数组。
返回¶
list[Dataset],原数据集合的子集列表。
代码示例¶
>>> import paddle
>>> class RangeDataset(paddle.io.Dataset):
... def __init__(self, start, stop):
... self.start = start
... self.stop = stop
...
... def __getitem__(self, index):
... return index + self.start
...
... def __len__(self):
... return self.stop - self.start
>>> # Example 1:
>>> a = paddle.io.Subset(dataset=RangeDataset(1, 4), indices=[0, 2])
>>> print(list(a))
[1, 3]
>>> # Example 2:
>>> b = paddle.io.Subset(dataset=RangeDataset(1, 4), indices=[1, 1])
>>> print(list(b))
[2, 2]