性能数据

请参考性能测试文档对模型进行测试。

测试环境

  • 模型

  • 测试机器

    • 骁龙 865

      • Xiaomi MI10, Snapdragon 865 (enable sdot instruction)

      • CPU: 1xA77 @2.84GHz + 3xA77 @2.42GHz + 4xA55 @1.8GHz

      • GPU: Adreno 650

    • 骁龙 855

      • Xiaomi MI9, Snapdragon 855 (enable sdot instruction)

      • CPU: 1xA76 @2.84GHz + 3xA76 @2.42GHz + 4xA55 @1.78GHz

      • GPU: Adreno 640

    • 骁龙 845

      • Xiaomi MI8, Snapdragon 845

      • CPU: 4xA75 @2.8GHz + 4xA75 @1.7GHz

      • GPU: Adreno 630

    • 骁龙 835

      • Xiaomi mi6, Snapdragon 835

      • CPU: 4xA73 @2.45GHz + 4xA53 @1.9GHz

      • GPU: Adreno 540

    • 骁龙 625

      • Xiaomi Redmi6 Pro, Snapdragon 625

      • CPU: 4xA53 @1.8GHz + 4xA53 @1.6GHz

      • GPU: Adreno 506

    • 麒麟 990

      • Huawei Mate 30, Kirin 990

      • CPU: 2xA76 @2.86GHz + 2xA76 @2.09GHz + 4xA55 @1.86GHz

      • GPU: 16 core Mali-G76

    • 麒麟 980

      • Huawei Mate 20, Kirin 980

      • CPU: 2xA76 @2.6GHz + 2xA76 @1.92Ghz + 4xA55 @1.8Ghz

      • GPU: 10 core Mali-G76

    • RK3399

      • CPU: 2xA72 @1.8GHz + 4xA53 @1.4Ghz

      • GPU: 4 core Mali-T860

  • 测试说明

    • Branch: release/v2.10, commit id: b2e9776

    • 使用 Android ndk-r20b,armv8 编译

    • CPU 线程数设为 1,绑定大核

    • 在 GPU 上运行时,开启了 Auto Tune

    • warmup=20, repeats=600,统计平均时间,单位 ms

    • 输入数据全部设为 1.f

测试数据

fp32 浮点模型测试数据

CPU 数据

运行时精度为 fp32 的性能数据如下:

模型 骁龙 865 骁龙 855 骁龙 845 骁龙 835 骁龙 625 麒麟 990 麒麟 980 RK3399
MobileNetV1 28.52 29.22 60.78 82.54 144.20 38.16 32.86 111.76
MobileNetV2 18.84 23.17 42.74 56.23 107.66 24.91 22.51 79.95
MobileNetV3_large_x1_0 14.55 18.39 32.49 41.95 96.30 19.46 17.78 71.17
MobileNetV3_small_x1_0 4.75 6.41 9.98 13.98 37.99 6.50 6.00 23.34
ResNet50 162.40 192.88 430.72 490.54 842.96 221.81 191.14 638.29
SSD_MobileNetV3_large 33.87 42.84 84.70 103.32 199.60 46.02 40.95 157.08
HRNet_w18 640.62 835.62 1687.78 2048.81 4724.20 910.09 820.42 3380.08

运行时精度为 fp16 的性能数据如下:

模型 骁龙 865 骁龙 855 骁龙 845 麒麟 990
MobileNetV1 14.83 15.79 29.62 20.64
MobileNetV2 9.49 10.28 18.93 12.29
MobileNetV3_large_x1_0 7.84 8.29 16.00 9.75
MobileNetV3_small_x1_0 2.58 3.03 5.85 3.47
ResNet50 84.06 87.10 179.46 109.38
SSD_MobileNetV3_large 18.32 19.99 40.13 24.37
HRNet_w18 388.43 430.27 954.59 544.75

GPU 数据

模型 骁龙 865 骁龙 855 骁龙 845 骁龙 835 骁龙 625 麒麟 990 麒麟 980 RK3399
MobileNetV1 7.05 8.85 10.46 10.87 71.42 8.15 13.74 45.91
MobileNetV2 9.48 9.70 8.58 14.14 52.09 9.32 13.08 37.27
MobileNetV3_large_x1_0 8.90 9.11 10.20 12.04 46.48 9.81 15.19 32.92
MobileNetV3_small_x1_0 5.79 5.54 8.52 11.43 20.00 6.45 8.71 18.42
ResNet50 29.70 35.46 45.23 53.66 392.62 36.15 54.23 238.12
SSD_MobileNetV3_large 27.69 35.21 33.37 42.31 152.37 27.25 35.79 90.37

int8 量化模型测试数据

CPU 数据

模型 骁龙 865 骁龙 855 骁龙 845 骁龙 835 骁龙 625 麒麟 990 麒麟 980 RK3399
MobileNetV1_quant 11.34 14.81 52.34 55.69 118.76 14.80 13.83 78.30
MobileNetV2_quant 10.55 14.06 33.99 40.87 85.81 14.22 13.06 57.94
MobileNetV3_large_x1_0_quant 8.11 10.76 24.63 31.30 70.86 10.52 9.73 48.36
MobileNetV3_small_x1_0_quant 3.04 4.20 8.93 11.27 25.13 4.10 3.75 17.87
ResNet50_quant 64.60 80.46 313.63 331.30 691.06 81.65 74.68 489.30
SSD_MobileNetV3_large_quant 20.84 22.82 64.16 74.12 165.91 27.11 25.29 119.92

华为昇腾 NPU 的性能数据

请参考 Paddle Lite 使用华为昇腾 NPU 预测部署的最新性能数据

华为麒麟 NPU 的性能数据

请参考 Paddle Lite 使用华为麒麟 NPU 预测部署的最新性能数据

瑞芯微 NPU 的性能数据

请参考 Paddle Lite 使用瑞芯微 NPU 预测部署的最新性能数据

晶晨 NPU 的性能数据

请参考 Paddle Lite 使用晶晨NPU 预测部署的最新性能数据

联发科 APU 的性能数据

请参考 Paddle Lite 使用联发科 APU 预测部署的最新性能数据

颖脉 NNA 的性能数据

请参考 Paddle Lite 使用颖脉 NNA 预测部署的最新性能数据