(始于 0.15.0)
控制每个 paddle 实例的线程数。
Int32 型,缺省值为 1。
FLAGS_paddle_num_threads=2 - 将每个实例的最大线程数设为 2。
(始于 1.3)
设置用于训练或预测的 GPU 设备。
以逗号分隔的设备 ID 列表,其中每个设备 ID 是一个非负整数,且应小于您的机器拥有的 GPU 设备总数。
FLAGS_selected_gpus=0,1,2,3,4,5,6,7 - 令 0-7 号 GPU 设备用于训练和预测。
使用该 flag 的原因是我们希望在 GPU 设备之间使用聚合通信,但通过 CUDA_VISIBLE_DEVICES 只能使用共享内存。