paddle.vision

paddle.vision 目录是飞桨在视觉领域的高层 API。具体如下:

内置数据集相关 API

API 名称

API 功能

Cifar10 数据集

Cifar100 数据集

FashionMNIST 数据集

Flowers 数据集

MNIST 数据集

VOC2012 数据集

内置模型相关 API

API 名称

API 功能

LeNet 模型

AlexNet 模型

AlexNet 模型

MobileNetV1 模型

MobileNetV1 模型

MobileNetV2 模型

MobileNetV2 模型

MobileNetV3Small 模型

MobileNetV3Large 模型

MobileNetV3Small 模型

MobileNetV3Large 模型

ResNet 模型

18 层的 ResNet 模型

34 层的 ResNet 模型

50 层的 ResNet 模型

101 层的 ResNet 模型

152 层的 ResNet 模型

50 层的 WideResNet 模型

101 层的 WideResNet 模型

ResNeXt-50 32x4d 模型

ResNeXt-50 64x4d 模型

ResNeXt-101 32x4d 模型

ResNeXt-101 64x4d 模型

ResNeXt-152 32x4d 模型

ResNeXt-152 64x4d 模型

VGG

VGG 模型

11 层的 VGG 模型

13 层的 VGG 模型

16 层的 VGG 模型

19 层的 VGG 模型

DenseNet 模型

121 层的 DenseNet 模型

161 层的 DenseNet 模型

169 层的 DenseNet 模型

201 层的 DenseNet 模型

264 层的 DenseNet 模型

InceptionV3 模型

InceptionV3 模型

GoogLeNet 模型

GoogLeNet 模型

SqueezeNet 模型

squeezenet1_0 模型

squeezenet1_1 模型

ShuffleNetV2 模型

输出通道缩放比例为 0.25 的 ShuffleNetV2 模型

输出通道缩放比例为 0.33 的 ShuffleNetV2 模型

输出通道缩放比例为 0.5 的 ShuffleNetV2 模型

输出通道缩放比例为 1.0 的 ShuffleNetV2 模型

输出通道缩放比例为 1.5 的 ShuffleNetV2 模型

输出通道缩放比例为 2.0 的 ShuffleNetV2 模型

使用 swish 进行激活的 ShuffleNetV2 模型

视觉操作相关 API

API 名称

API 功能

计算 2-D 可变形卷积

计算 2-D 可变形卷积

生成 YOLO 检测框

计算 YOLO 损失

数据处理相关 API

API 名称

API 功能

调整图像亮度

调整图像对比度

调整图像色调

图像处理的基类,用于自定义图像处理

调整图像亮度

对图像进行中心裁剪

对图像进行中心裁剪

随机调整图像的亮度,对比度,饱和度和色调

以列表的方式将数据集预处理的接口进行组合

调整图像对比度

对图像进行裁剪

对图像进行灰度化

水平翻转图像

调整图像色调

对图像进行归一化

对图像进行归一化

Pad

对图像进行填充

pad

对图像进行填充

对图像随机裁剪

基于概率水平翻转图像

基于概率随机按照大小和长宽比对图像进行裁剪

对图像随机旋转

基于概率垂直翻转图像

对图像调整大小

对图像调整大小

对图像随机旋转

调整图像饱和度

对图像进行灰度化

将`PIL.Image`或`numpy.ndarray`转为`paddle.Tensor`

将`PIL.Image`或`numpy.ndarray`转为`paddle.Tensor`

将输入的图像数据更改为目标格式

垂直翻转图像

其他 API

API 名称

API 功能

获取用于加载图像的模块名称

读取一个图像

指定用于加载图像的后端