Subset

class paddle.io. Subset ( dataset, indices ) [源代码]

用于构造一个数据集级的数据子数据集。

给定原数据集合的指标数组,可以以此数组构造原数据集合的子数据集合。

参数

  • datasets (Dataset) - 原数据集。

  • indices (sequence) - 用于提取子集的原数据集合指标数组。

返回

list[Dataset],原数据集合的子集列表。

代码示例

>>> import paddle

>>> class RangeDataset(paddle.io.Dataset):
...     def __init__(self, start, stop):
...         self.start = start
...         self.stop = stop
...
...     def __getitem__(self, index):
...         return index + self.start
...
...     def __len__(self):
...         return self.stop - self.start

>>> # Example 1:
>>> a = paddle.io.Subset(dataset=RangeDataset(1, 4), indices=[0, 2])
>>> print(list(a))
[1, 3]

>>> # Example 2:
>>> b = paddle.io.Subset(dataset=RangeDataset(1, 4), indices=[1, 1])
>>> print(list(b))
[2, 2]