飞桨框架昆仑 XPU 版训练示例¶

使用 XPU 训练与 cpu/gpu 相同，只需要加上-o use_xpu=True, 表示执行在昆仑设备上。

ResNet50 下载并运行示例：¶

模型文件下载命令：

cd path_to_clone_PaddleClas
git clone -b release/static https://github.com/PaddlePaddle/PaddleClas.git

也可以访问 PaddleClas 的github repo直接下载源码。

配置 XPU 进行训练的命令非常简单：

#FLAGS 指定单卡或多卡训练，此示例运行 2 个卡
export FLAGS_selected_xpus=0,1
#启动训练
python3.7 tools/static/train.py -c configs/quick_start/ResNet50_vd_finetune_kunlun.yaml -o use_gpu=False -o use_xpu=True -o is_distributed=False

如果需要指定更多的卡（比如 8 卡），需要配置合适的训练参数，可使用如下命令自动修改：

export FLAGS_selected_xpus=0,1,2,3,4,5,6,7
python3.7 -m paddle.distributed.launch \
        --ips=${ips} \
        --xpus=${FLAGS_selected_xpus} \
        --log_dir log \
        tools/static/train.py \
        -c ${config_yaml} \
        -o is_distributed=False \
        -o epochs=${epochs} \
        -o TRAIN.batch_size=${total_batch_size} \
        -o LEARNING_RATE.params.lr=${lr} \
        -o use_gpu=False \
        -o use_xpu=True

其他模型的训练示例可在飞桨对昆仑 XPU 芯片的支持中支持模型列表下的模型链接中找到。