1
大模型落地之路维艰
图1 PaddleNLP“训-压-推”全流程加速方案
2
整套模型轻量化技术亮相
文心ERNIE-Tiny在线蒸馏方案
图2 模型蒸馏示意
图3 CPU下文心ERNIE 3.0轻量级模型时延与效果图
图4 GPU下文心ERNIE 3.0轻量级模型时延与效果图
在PaddleNLP中,可一键加载以上模型。
图5 代码展示
此外,PaddleNLP还提供了CLUE Benchmark的一键评测脚本,并提供了大量中文预训练模型在CLUE上的效果。PaddleNLP接入了Grid Search策略,支持在超参列表范围内自动搜索超参,保留最佳结果和对应的超参数,方便一键复现模型效果,且打通了CLUE各个任务“数据处理-训练-预测-结果提交”的流程,方便用户快速提交CLUE榜单[2]。
动态裁剪和量化推理
图6 PaddleNLP模型裁剪、量化使用示例
速度领先的文本处理库
FasterTokenizer
文心ERNIE-Tiny在线蒸馏技术加持的文心ERNIE 3.0轻量级模型本身已经“又快又准”,再加上裁剪、量化策略以及飞桨高性能文本处理算子库FasterTokenizer就能实现更强大的加速效果,如下图所示:
图7 GPU下多种性能优化策略的加速比展示
图8 同类产品中文切词效率对比
图9 FasterTokenizer调用方法
多种部署方案
飞桨提供了服务端、移动端、网页前端等丰富的部署工具。PaddleNLP本次围绕文心ERNIE 3.0发布了一系列高性能部署方案,且通过Paddle2ONNX转换工具进一步拓宽了飞桨模型的部署通路,适用于多场景的部署需求。用户可参照官方提供的完整示例,快速部署上线,包括Python服务端部署、Triton Inference Server服务化部署、Paddle Serving服务化部署、ONNXRuntime部署等多个示例。
图10 飞桨部署方案说明
3
文心ERNIE-Tiny技术实际应用落地介绍
实际案例 1
实际案例 2
某金融行业用户使用文心ERNIE 3.0-Mini实现业务技术升级:
实际案例 3
4
干货福利
Notebook教程
PaddleNLP还提供了一系列围绕文心ERNIE 3.0的Notebook交互式教程,方便大家快速上手实践,可进入官方地址自取。
图11 ERNIE 3.0应用示例
官网地址
https://github.com/PaddlePaddle/PaddleNLP/tree/develop/model_zoo/ernie-3.0
入群有礼
图12 PaddleNLP学习大礼包
5
PaddleNLP:不忘初心
感谢广大开发者的支持
图13 PaddleNLP影响力动图
了解更多
官网地址:
https://www.paddlepaddle.org.cn
参考来源
[2] https://www.cluebenchmarks.com/
[3] Fast WordPiece Tokenization.
关注【飞桨PaddlePaddle】公众号
获取更多技术内容~
1
大模型落地之路维艰
图1 PaddleNLP“训-压-推”全流程加速方案
2
整套模型轻量化技术亮相
文心ERNIE-Tiny在线蒸馏方案
图2 模型蒸馏示意
图3 CPU下文心ERNIE 3.0轻量级模型时延与效果图
图4 GPU下文心ERNIE 3.0轻量级模型时延与效果图
在PaddleNLP中,可一键加载以上模型。
图5 代码展示
此外,PaddleNLP还提供了CLUE Benchmark的一键评测脚本,并提供了大量中文预训练模型在CLUE上的效果。PaddleNLP接入了Grid Search策略,支持在超参列表范围内自动搜索超参,保留最佳结果和对应的超参数,方便一键复现模型效果,且打通了CLUE各个任务“数据处理-训练-预测-结果提交”的流程,方便用户快速提交CLUE榜单[2]。
动态裁剪和量化推理
图6 PaddleNLP模型裁剪、量化使用示例
速度领先的文本处理库
FasterTokenizer
文心ERNIE-Tiny在线蒸馏技术加持的文心ERNIE 3.0轻量级模型本身已经“又快又准”,再加上裁剪、量化策略以及飞桨高性能文本处理算子库FasterTokenizer就能实现更强大的加速效果,如下图所示:
图7 GPU下多种性能优化策略的加速比展示
图8 同类产品中文切词效率对比
图9 FasterTokenizer调用方法
多种部署方案
飞桨提供了服务端、移动端、网页前端等丰富的部署工具。PaddleNLP本次围绕文心ERNIE 3.0发布了一系列高性能部署方案,且通过Paddle2ONNX转换工具进一步拓宽了飞桨模型的部署通路,适用于多场景的部署需求。用户可参照官方提供的完整示例,快速部署上线,包括Python服务端部署、Triton Inference Server服务化部署、Paddle Serving服务化部署、ONNXRuntime部署等多个示例。
图10 飞桨部署方案说明
3
文心ERNIE-Tiny技术实际应用落地介绍
实际案例 1
实际案例 2
某金融行业用户使用文心ERNIE 3.0-Mini实现业务技术升级:
实际案例 3
4
干货福利
Notebook教程
PaddleNLP还提供了一系列围绕文心ERNIE 3.0的Notebook交互式教程,方便大家快速上手实践,可进入官方地址自取。
图11 ERNIE 3.0应用示例
官网地址
https://github.com/PaddlePaddle/PaddleNLP/tree/develop/model_zoo/ernie-3.0
入群有礼
图12 PaddleNLP学习大礼包
5
PaddleNLP:不忘初心
感谢广大开发者的支持
图13 PaddleNLP影响力动图
了解更多
官网地址:
https://www.paddlepaddle.org.cn
参考来源
[2] https://www.cluebenchmarks.com/
[3] Fast WordPiece Tokenization.
关注【飞桨PaddlePaddle】公众号
获取更多技术内容~