paddle.vision

paddle.vision 目录是飞桨在视觉领域的高层 API。具体如下:

内置数据集相关 API

API 名称

API 功能

通用数据加载方式 DatasetFolder

通用数据加载方式 ImageFolder

Cifar10 数据集

Cifar100 数据集

FashionMNIST 数据集

Flowers 数据集

MNIST 数据集

VOC2012 数据集

内置模型相关 API

API 名称

API 功能

LeNet 模型

AlexNet 模型

AlexNet 模型

MobileNetV1 模型

MobileNetV1 模型

MobileNetV2 模型

MobileNetV2 模型

MobileNetV3Small 模型

MobileNetV3Large 模型

MobileNetV3Small 模型

MobileNetV3Large 模型

ResNet 模型

18 层的 ResNet 模型

34 层的 ResNet 模型

50 层的 ResNet 模型

101 层的 ResNet 模型

152 层的 ResNet 模型

50 层的 WideResNet 模型

101 层的 WideResNet 模型

ResNeXt-50 32x4d 模型

ResNeXt-50 64x4d 模型

ResNeXt-101 32x4d 模型

ResNeXt-101 64x4d 模型

ResNeXt-152 32x4d 模型

ResNeXt-152 64x4d 模型

VGG

VGG 模型

11 层的 VGG 模型

13 层的 VGG 模型

16 层的 VGG 模型

19 层的 VGG 模型

DenseNet 模型

121 层的 DenseNet 模型

161 层的 DenseNet 模型

169 层的 DenseNet 模型

201 层的 DenseNet 模型

264 层的 DenseNet 模型

InceptionV3 模型

InceptionV3 模型

GoogLeNet 模型

GoogLeNet 模型

SqueezeNet 模型

squeezenet1_0 模型

squeezenet1_1 模型

ShuffleNetV2 模型

输出通道缩放比例为 0.25 的 ShuffleNetV2 模型

输出通道缩放比例为 0.33 的 ShuffleNetV2 模型

输出通道缩放比例为 0.5 的 ShuffleNetV2 模型

输出通道缩放比例为 1.0 的 ShuffleNetV2 模型

输出通道缩放比例为 1.5 的 ShuffleNetV2 模型

输出通道缩放比例为 2.0 的 ShuffleNetV2 模型

使用 swish 进行激活的 ShuffleNetV2 模型

视觉操作相关 API

API 名称

API 功能

读取并输出文件的字节内容(1-D Tensor)

将 JPEG 图像解码为三维 RGB Tensor 或者 一维灰度 Tensor

兴趣区域的最大池化

兴趣区域的最大池化

位置敏感的兴趣区域池化

位置敏感的兴趣区域池化

基于双线性插值的兴趣区域对齐

基于双线性插值的兴趣区域对齐

计算 2-D 可变形卷积

计算 2-D 可变形卷积

生成 YOLO 检测框

计算 YOLO 损失

为 SSD 系列目标检测算法生成候选框

生成候选检测框

将候选检测框分配到不同的 FPN 层级

编码/解码带有先验框信息的目标边界框

nms

计算非极大抑制

数据处理相关 API

API 名称

API 功能

调整图像亮度

调整图像对比度

调整图像色调

图像处理的基类,用于自定义图像处理

调整图像亮度

对图像进行中心裁剪

对图像进行中心裁剪

随机调整图像的亮度,对比度,饱和度和色调

以列表的方式将数据集预处理的接口进行组合

调整图像对比度

对图像进行裁剪

对图像进行灰度化

水平翻转图像

调整图像色调

对图像进行归一化

对图像进行归一化

Pad

对图像进行填充

pad

对图像进行填充

对图像随机裁剪

基于概率水平翻转图像

基于概率随机按照大小和长宽比对图像进行裁剪

对图像随机旋转

基于概率垂直翻转图像

对图像调整大小

对图像调整大小

对图像随机旋转

对图像进行透视变换

基于概率对图像进行透视变换

对图像进行仿射变换

基于随机产生的变换矩阵参数,对图像进行仿射变换

使用给定的值擦除输入图像选定区域中的像素

擦除图像中随机选择的矩形区域内的像素

调整图像饱和度

对图像进行灰度化

将`PIL.Image`或`numpy.ndarray`转为`paddle.Tensor`

将`PIL.Image`或`numpy.ndarray`转为`paddle.Tensor`

将输入的图像数据更改为目标格式

垂直翻转图像

其他 API

API 名称

API 功能

获取用于加载图像的模块名称

读取一个图像

指定用于加载图像的后端