# PaddleLite使用X86预测部署
## 一、Docker或者Linux/Mac环境
Paddle-Lite 支持在Docker或Linux环境编译x86预测库。环境搭建参考[编译环境准备](../source_compile/compile_env)。
### 编译
1、 下载代码
```bash
# 下载Paddle-Lite源码
git clone https://github.com/PaddlePaddle/Paddle-Lite.git
# 切换到release分支
git checkout release/v2.6.0
```
2、 源码编译
```bash
cd Paddle-Lite
# 请在Paddle-Lite当前目录下执行脚本
./lite/tools/build.sh --build_python=ON x86
# 其他可选择编译选项
--with_log=ON/OFF # 编译支持LOG信息输出的预测库,默认值 ON
--build_python=ON/OFF # 编译支持Python API的预测库,默认值 OFF
--with_extra=ON/OFF # 编译支持全量算子的预测库,当Python打开时默认打开,否则为 OFF
--with_static_mkl=ON/OFF # 编译静态链接的MKL库,否则为动态链接,默认值为 OFF
--build_opencl=ON/OFF # 编译支持OpenCL的预测库,默认值为 OFF,如`./lite/tools/build.sh --build_opencl=ON x86`
--with_avx=ON/OFF # 使用AVX/SSE指令对X86 Kernel进行加速,默认值为 ON
```
注:若在Linux OS上使用Intel OpenCL Runtime,需要先[下载并安装对应驱动到默认路径](https://software.intel.com/content/www/us/en/develop/articles/opencl-drivers.html)。
### 编译结果说明
x86编译结果位于 `build.lite.x86/inference_lite_lib`
```shell
build.lite.x86/inference_lite_lib/
├── bin
│ └── test_model_bin 可执行工具文件
├── cxx C++ 预测库和头文件
│ ├── include C++ 头文件
│ │ ├── paddle_api.h
│ │ └── ...
│ └── lib C++ 预测库
│ ├── libpaddle_api_full_bundled.a C++ full_api 静态库
│ ├── libpaddle_api_light_bundled.a C++ light_api 静态库
│ ├── libpaddle_full_api_shared.so C++ full_api 动态库
│ └── libpaddle_light_api_shared.so C++ light_api 动态库
├── demo
│ ├── cxx
│ │ ├── mobilenetv1_full 使用full_api 执行预测的C++ demo
│ │ └── mobilenetv1_light 使用light_api 执行预测的C++ demo
│ └── python
│ ├── mobilenetv1_full_api.py 使用full_api 执行预测的Python demo
│ └── mobilenetv1_light_api.py 使用light_api 执行预测的Python demo
├── python Python 预测库和whl包
│ ├── install
│ │ ├── dist
│ │ │ └── paddlelite-*.whl
│ └── lib Python whl包依赖的库文件
│ └── lite.so
└── third_party
└── mklml 依赖的第三方加速库Intel(R) MKL
└── lib
├── libiomp5.so
├── libmklml_gnu.so
└── libmklml_intel.so
```
### x86预测API使用示例
1、`mobilenetv1_full`目录结构
```bash
mobilenetv1_full/
|-- CMakeLists.txt
|-- build.sh
|-- build.bat
-- mobilenet_full_api.cc
```
本demo使用cmake构建`CMakeLists.txt`为cmake脚本,`mobilenet_full_api.cc`是x86示例的源代码、`build.sh`为编译的脚本。
2、demo使用方法
``` bash
# 1、编译
cd mobilenetv1_full
sh build.sh
```
编译结果为当前目录下的 `mobilenet_full_api `
``` bash
# 2、执行预测
./mobilenet_full_api ./mobilenet_v1
```
下载并解压模型[`mobilenet_v1`](http://paddle-inference-dist.bj.bcebos.com/mobilenet_v1.tar.gz)到当前目录,执行以上命令进行预测。
```bash
# 3、执行demo后输出结果如下,全一输入下mobilenet_v1的预测结果
Output shape 1000
Output[0]: 0.000191312
Output[100]: 0.000159713
Output[200]: 0.000264313
Output[300]: 0.000210793
Output[400]: 0.00103236
Output[500]: 0.000110071
Output[600]: 0.00482924
Output[700]: 0.00184533
Output[800]: 0.000202116
Output[900]: 0.000585591
```
3、示例源码`mobilenet_full_api.cc`
```c++
#include
#include
#include "paddle_api.h"
using namespace paddle::lite_api; // NOLINT
int64_t ShapeProduction(const shape_t& shape) {
int64_t res = 1;
for (auto i : shape) res *= i;
return res;
}
void RunModel(std::string model_dir) {
// 1. Create CxxConfig
CxxConfig config;
config.set_model_dir(model_dir);
config.set_valid_places({
Place{TARGET(kX86), PRECISION(kFloat)},
Place{TARGET(kHost), PRECISION(kFloat)}
});
// 2. Create PaddlePredictor by CxxConfig
std::shared_ptr predictor =
CreatePaddlePredictor(config);
// 3. Prepare input data
std::unique_ptr input_tensor(std::move(predictor->GetInput(0)));
input_tensor->Resize({1, 3, 224, 224});
auto* data = input_tensor->mutable_data();
for (int i = 0; i < ShapeProduction(input_tensor->shape()); ++i) {
data[i] = 1;
}
// 4. Run predictor
predictor->Run();
// 5. Get output
std::unique_ptr output_tensor(
std::move(predictor->GetOutput(0)));
std::cout << "Output shape " << output_tensor->shape()[1] << std::endl;
for (int i = 0; i < ShapeProduction(output_tensor->shape()); i += 100) {
std::cout << "Output[" << i << "]: " << output_tensor->data()[i]
<< std::endl;
}
}
int main(int argc, char** argv) {
if (argc < 2) {
std::cerr << "[ERROR] usage: ./" << argv[0] << " naive_buffer_model_dir\n";
exit(1);
}
std::string model_dir = argv[1];
RunModel(model_dir);
return 0;
}
```
## 二、Windows环境
### 环境准备
#### 编译环境需求
- Windows 10 专业版
- 目前Windows暂不支持GPU编译
- *Python 版本 2.7/3.5.1+ (64 bit)*
- *pip 或 pip3 版本 9.0.1+ (64 bit)*
- *Visual Studio 2015 Update3*
#### 安装步骤
1. cmake 需要3.15版本, 可在官网[下载](https://cmake.org/download/),并添加到环境变量中。
2. python 需要2.7 及以上版本, 可在官网[下载](https://www.python.org/download/releases/2.7/)。
3. git可以在官网[下载](https://gitforwindows.org/),并添加到环境变量中
### 编译
1、 下载代码
```bash
git clone https://github.com/PaddlePaddle/Paddle-Lite.git
# 切换到release分支
git checkout release/v2.7
```
2、 源码编译(需要按照提示输入对应的参数)
```dos
cd Paddle-Lite
lite\tools\build_windows.bat with_extra with_profile
# 注意默认编译Windows X64平台,如果需要编译X86平台,需要加入build_x86选项
lite\tools\build_windows.bat build_x86
# 如果需要根据模型裁剪预测库,则需要在with_strip之后输入opt model dir的路径
lite\tools\build_windows.bat with_strip D:\Paddle-Lite\opt_model_dir
```
编译脚本`build_windows.bat`,追加参数说明:
| 参数 | 介绍 | 值 |
|-----------|-------------|-------------|
| without_log | 可选,是否编译带日志的预测库(默认为ON,即日志打开)| `ON`、`OFF` |
| without_python | 可选,是否编译python预测库(默认为ON,即编译Python)| `ON`、`OFF` |
| with_extra | 可选,是否编译全量预测库(当Python打开时默认打开,否则为OFF),详情可参考[预测库说明](./library.html)。 | `ON`、`OFF` |
| with_profile | 可选,是否支持分析器模式(默认为OFF)| `ON`、`OFF` |
| with_strip | 可选,是否根据模型裁剪预测库(默认为OFF),详情可参考[裁剪预测库](../source_compile/library_trailoring.html)。| `ON`、`OFF` |
| build_x86 | 可选,是否编译X86平台预测库(默认为OFF,即编译X64平台)| `ON`、`OFF` |
| with_static_mkl | 可选,是否静态链接Intel(R) MKL加速库(默认为OFF,即动态链接) | `ON`、`OFF` |
| with_dynamic_crt | 可选,是否动态链接MSVC Rumtime即MD_DynamicRelease(默认为OFF,即静态链接) | `ON`、`OFF` |
| with_opencl | 可选,是否开启OpenCL(默认为OFF,即编译的预测库仅在CPU上运行,当设为`ON`时,编译出的预测库支持在GPU上运行) | `ON`、`OFF` |
| without_avx | 可选,使用AVX/SSE指令对X86 Kernel进行加速(默认为ON) | `ON`、`OFF` |
### 编译结果说明
x86编译结果位于 `build.lite.x86/inference_lite_lib`
**具体内容**说明:
1、 `cxx`文件夹:包含c++的库文件与相应的头文件
- `include` : 头文件
- `lib` : 库文件
- 静态库文件:
- `libpaddle_api_full_bundled.lib` :full_api 静态库
- `libpaddle_api_light_bundled.lib` :light_api 静态库
2、 `third_party` 文件夹:依赖的第三方预测库mklml
- mklml : Paddle-Lite预测库依赖的mklml数学库
3、 `demo/cxx`文件夹:x86预测库的C++ 示例demo
- `mobilenetv1_full` :使用full_api 执行mobilenet_v1预测的C++ demo
- `mobilenetv1_light` :使用light_api 执行mobilenet_v1预测的C++ demo
4、 `demo/python`: x86预测库的Python示例demo
- `mobilenetv1_full_api.py`:使用full_api 执行mobilenet_v1预测的Python demo
- `mobilenetv1_light_api.py`:使用full_api 执行mobilenet_v1预测的Python demo
5、 `python`文件夹:包含python的库文件和对应的.whl包
- `install`文件夹:编译成功的.whl包位于`install/dist/*.whl`
- `lib`文件夹:.whl包依赖的库文件
### x86预测API使用示例
1、`mobilenetv1_full`目录结构
```bash
mobilenetv1_full/
|-- CMakeLists.txt
|-- build.sh
|-- build.bat
`-- mobilenet_full_api.cc
```
本demo使用cmake构建`CMakeLists.txt`为cmake脚本,`mobilenet_full_api.cc`是x86示例的源代码、`build.sh`为Linux x86编译的脚本,`build.bat`为windows x86编译脚本。
2、demo使用方法
``` bash
# 1、编译
cd mobilenetv1_full
build.bat
cd build
```
编译结果为当前目录下的 `Release\mobilenet_full_api.exe `
> 注意:当前示例为预测库在默认编译选项下编译,即基于 “X64平台” 和 “静态MSVC Rumtime”。如果预测库是基于 “X86平台” 或者 “动态MSVC Rumtime” 编译,请参照`build_windows.bat`和 `Paddle-Lite\CMakeList.txt`,相应修改 `build.bat` 和 `CMakeList.txt` 中的相关配置使其预测库保持一致。
``` dos
# 2、执行预测
Release\mobilenet_full_api.exe mobilenet_v1
```
下载并解压模型 [mobilenet_v1](http://paddle-inference-dist.bj.bcebos.com/mobilenet_v1.tar.gz) 到当前`build`目录,执行以上命令进行预测。