精度与性能¶
如果您的推理程序输出结果存在精度异常,或者您的程序性能和内存消耗不符合您的预期,可以参考以下常见问题并尝试解决。
Predictor 是否有 Profile 工具。
答:config.EnableProfile()
可以打印op耗时,请参考API文档-Profile设置。同一个模型的推理耗时不稳定。
答: 请按以下方向排查: 1)硬件资源(CPU、GPU等)是否没有他人抢占。 2)输入是否一致,某些模型推理时间跟输入有关,比如检测模型的候选框数量。 3)使用 TensorRT 时,初始的优化阶段比较耗时,可以通过少量数据 warm up 的方式解决。如何开启 CPU 预测的多线程加速。
答: 请使用config.EnableMKLDNN()
和config.SetCpuMathLibraryNumThreads()
,请参考x86 CPU预测。