paddle.vision¶
paddle.vision 目录是飞桨在视觉领域的高层 API。具体如下:
内置数据集相关 API¶
API 名称 |
API 功能 |
---|---|
|
通用数据加载方式 DatasetFolder |
|
通用数据加载方式 ImageFolder |
|
Cifar10 数据集 |
|
Cifar100 数据集 |
|
FashionMNIST 数据集 |
|
Flowers 数据集 |
|
MNIST 数据集 |
|
VOC2012 数据集 |
内置模型相关 API¶
API 名称 |
API 功能 |
---|---|
|
LeNet 模型 |
|
AlexNet 模型 |
|
AlexNet 模型 |
|
MobileNetV1 模型 |
|
MobileNetV1 模型 |
|
MobileNetV2 模型 |
|
MobileNetV2 模型 |
|
MobileNetV3Small 模型 |
|
MobileNetV3Large 模型 |
|
MobileNetV3Small 模型 |
|
MobileNetV3Large 模型 |
|
ResNet 模型 |
|
18 层的 ResNet 模型 |
|
34 层的 ResNet 模型 |
|
50 层的 ResNet 模型 |
|
101 层的 ResNet 模型 |
|
152 层的 ResNet 模型 |
|
50 层的 WideResNet 模型 |
|
101 层的 WideResNet 模型 |
|
ResNeXt-50 32x4d 模型 |
|
ResNeXt-50 64x4d 模型 |
|
ResNeXt-101 32x4d 模型 |
|
ResNeXt-101 64x4d 模型 |
|
ResNeXt-152 32x4d 模型 |
|
ResNeXt-152 64x4d 模型 |
|
VGG 模型 |
|
11 层的 VGG 模型 |
|
13 层的 VGG 模型 |
|
16 层的 VGG 模型 |
|
19 层的 VGG 模型 |
|
DenseNet 模型 |
|
121 层的 DenseNet 模型 |
|
161 层的 DenseNet 模型 |
|
169 层的 DenseNet 模型 |
|
201 层的 DenseNet 模型 |
|
264 层的 DenseNet 模型 |
|
InceptionV3 模型 |
|
InceptionV3 模型 |
|
GoogLeNet 模型 |
|
GoogLeNet 模型 |
|
SqueezeNet 模型 |
|
squeezenet1_0 模型 |
|
squeezenet1_1 模型 |
|
ShuffleNetV2 模型 |
|
输出通道缩放比例为 0.25 的 ShuffleNetV2 模型 |
|
输出通道缩放比例为 0.33 的 ShuffleNetV2 模型 |
|
输出通道缩放比例为 0.5 的 ShuffleNetV2 模型 |
|
输出通道缩放比例为 1.0 的 ShuffleNetV2 模型 |
|
输出通道缩放比例为 1.5 的 ShuffleNetV2 模型 |
|
输出通道缩放比例为 2.0 的 ShuffleNetV2 模型 |
|
使用 swish 进行激活的 ShuffleNetV2 模型 |
视觉操作相关 API¶
API 名称 |
API 功能 |
---|---|
|
读取并输出文件的字节内容(1-D Tensor) |
|
将 JPEG 图像解码为三维 RGB Tensor 或者 一维灰度 Tensor |
|
兴趣区域的最大池化 |
|
兴趣区域的最大池化 |
|
位置敏感的兴趣区域池化 |
|
位置敏感的兴趣区域池化 |
|
基于双线性插值的兴趣区域对齐 |
|
基于双线性插值的兴趣区域对齐 |
|
计算 2-D 可变形卷积 |
|
计算 2-D 可变形卷积 |
|
生成 YOLO 检测框 |
|
计算 YOLO 损失 |
|
为 SSD 系列目标检测算法生成候选框 |
|
生成候选检测框 |
|
将候选检测框分配到不同的 FPN 层级 |
|
编码/解码带有先验框信息的目标边界框 |
|
计算非极大抑制 |
数据处理相关 API¶
API 名称 |
API 功能 |
---|---|
|
调整图像亮度 |
|
调整图像对比度 |
|
调整图像色调 |
|
图像处理的基类,用于自定义图像处理 |
|
调整图像亮度 |
|
对图像进行中心裁剪 |
|
对图像进行中心裁剪 |
|
随机调整图像的亮度,对比度,饱和度和色调 |
|
以列表的方式将数据集预处理的接口进行组合 |
|
调整图像对比度 |
|
对图像进行裁剪 |
|
对图像进行灰度化 |
|
水平翻转图像 |
|
调整图像色调 |
|
对图像进行归一化 |
|
对图像进行归一化 |
|
对图像进行填充 |
|
对图像进行填充 |
|
对图像随机裁剪 |
|
基于概率水平翻转图像 |
|
基于概率随机按照大小和长宽比对图像进行裁剪 |
|
对图像随机旋转 |
|
基于概率垂直翻转图像 |
|
对图像调整大小 |
|
对图像调整大小 |
|
对图像随机旋转 |
|
对图像进行透视变换 |
|
基于概率对图像进行透视变换 |
|
对图像进行仿射变换 |
|
基于随机产生的变换矩阵参数,对图像进行仿射变换 |
|
使用给定的值擦除输入图像选定区域中的像素 |
|
擦除图像中随机选择的矩形区域内的像素 |
|
调整图像饱和度 |
|
对图像进行灰度化 |
|
将`PIL.Image`或`numpy.ndarray`转为`paddle.Tensor` |
|
将`PIL.Image`或`numpy.ndarray`转为`paddle.Tensor` |
|
将输入的图像数据更改为目标格式 |
|
垂直翻转图像 |
其他 API¶
API 名称 |
API 功能 |
---|---|
|
获取用于加载图像的模块名称 |
|
读取一个图像 |
|
指定用于加载图像的后端 |