paddle.device¶

paddle.device 模块提供了一系列与设备相关的 API，用于管理和配置计算设备。具体如下：

paddle.device 目录下包含 cuda 目录， cuda 目录中存放 CUDA 相关的 API。具体如下：

设备设置与属性获取¶

API 名称	API 功能
is_compiled_with_cinn	检查 `whl` 包是否可以被用来在 CINN 上运行模型
is_compiled_with_cuda	检查 `whl` 包是否可以被用来在 GPU 上运行模型
is_compiled_with_custom_device	检查 `whl` 包是否可以被用来在指定类型的自定义新硬件上运行模型
is_compiled_with_ipu	检查 `whl` 包是否可以被用来在 Graphcore IPU 上运行模型
is_compiled_with_mlu	检查 `whl` 包是否可以被用来在 Cambricon MLU 上运行模型
is_compiled_with_npu	检查 `whl` 包是否可以被用来在 NPU 上运行模型
is_compiled_with_rocm	检查 `whl` 包是否可以被用来在 AMD 或海光 GPU(ROCm) 上运行模型
is_compiled_with_xpu	检查 `whl` 包是否可以被用来在 Baidu Kunlun XPU 上运行模型

API 名称	API 功能
IPUPlace	`IPUPlace` 是一个设备描述符，指定 `IPUPlace` 则模型将会运行在该设备上
MLUPlace	`MLUPlace` 是一个设备描述符，指定 `MLUPlace` 则模型将会运行在该设备上
XPUPlace	`XPUPlace` 是一个设备描述符，表示一个分配或将要分配 `Tensor` 的 Baidu Kunlun XPU 设备

类名称	辅助类功能
Stream	`StreamBase` 的设备流包装器
Event	`StreamBase` 的设备事件包装器

API 名称	API 功能
current_stream	通过 device 返回当前的 stream
set_stream	设置当前的 stream
stream_guard	切换当前的 stream 为输入指定的 stream，该 API 目前仅支持动态图模式
synchronize	等待给定的设备上的计算完成

API 名称	API 功能
Stream	CUDA `StreamBase` 的设备流包装器，该 API 未来计划废弃，不推荐使用
Event	CUDA `StreamBase` 的设备事件包装器，该 API 未来计划废弃，不推荐使用
current_stream	通过 device 返回当前的 CUDA stream
device_count	返回值是 int，表示当前程序可用的 GPU 数量
empty_cache	用于释放显存分配器中空闲的显存
get_device_capability	获取 CUDA 设备计算能力的主要和次要修订号
get_device_name	获取 CUDA 设备名称
get_device_properties	获取 CUDA 设备属性
max_memory_allocated	返回给定设备上分配给 Tensor 的显存峰值统计
max_memory_reserved	返回给定设备上由 Allocator 管理的显存峰值统计
memory_allocated	返回给定设备上当前分配给 Tensor 的显存大小
memory_reserved	返回给定设备上当前由 Allocator 管理的显存大小
reset_max_memory_allocated	重置给定设备上分配给 Tensor 的显存峰值统计
reset_max_memory_reserved	重置给定设备上由 Allocator 管理的显存峰值统计
stream_guard	切换当前的 CUDA stream 为输入指定的 stream，该 API 目前仅支持动态图模式
synchronize	等待给定的 CUDA 设备上的计算完成