随着“科技兴国”战略思想的提出,越来越多的人工智能技术被应用于体育、教育、农业、能源、金融、医疗等各行各业。在刚刚闭幕的冬奥会上,人工智能、5G、云服务等技术的应用,让世界人民看到了新时代中国的风采。中国已经按下了从制造业大国向科技强国转型的启动键,越来越多的企业期望引入人工智能等新技术来提升竞争力。
飞桨结合多年与合作伙伴在人工智能产业落地中积累的经验,总结了工程师在使用开源模型研发应用时面临的四大难题,如图1所示。
图1 AI产业落地时面临的四大难题
那么,在复杂的AI产业应用中,如何选择易用、稳定、可靠的开源模型呢?针对用户在AI产业落地时面临的四大难题,飞桨提出了产业级开源模型库方案,核心能力如下:
支持500+个精选算法和预训练模型,全面覆盖深度学习主流应用领域,如计算机视觉、语音、自然语言处理、推荐、强化学习等。
支持23个特色的PP系列模型,满足对模型精度和推理速度都有较高要求的产业应用场景。
1
飞桨产业级开源模型库的
关键能力
提供超过500个精选算法和预训练模型
全面覆盖深度学习应用领域
图2是飞桨产业级开源模型库全景,覆盖计算机视觉(PaddleCV)、自然语言处理(PaddleNLP)、推荐(PaddleRec)和语音(PaddleSpeech)四大深度学习应用领域,以及在产业中处于前沿探索的新兴领域,如图神经网络、强化学习、量子学习和科学计算、生物计算等。截至2022年5月,官方支持的算法总数超过500个,包含经过产业实践长期打磨的主流模型、PP系列模型,以及国际竞赛中的夺冠模型,所有模型都支持动态图开发,助力产业快速应用。
图2 左右滑动查看飞桨开源模型库全景
提供飞桨特色的PP系列模型
实现AI产业落地时模型精度和性能的平衡
大多数开源模型都侧重关注模型精度,缺少对于模型推理性能的考量。飞桨综合了模型精度和性能的平衡,开发特色的PP系列模型,如图3所示,覆盖了目标检测、OCR、语义理解都多个高频应用场景。以PP-YOLOv2、PP-OCRv2为例,在数据增强、骨干网络、检测头、损失函数、训练技巧等方面分别有13项和19项兼顾精度和性能的优化策略。在AI 产业应用时,建议用户优先考虑PP系列模型,达到事半功倍的效果。
图3 飞桨特色的PP系列模型和应用场景
提供端到端的开发套件
预置大量优化策略,支撑全流程优化
无论模型性能多优异,由于真实的生产环境的复杂和多样性,在落地产业时,都需要结合业务需求进行模型优化。飞桨端到端的开发套件中预置了大量优化策略,支撑全流程优化,用户只需要修改配置文件,即可调整模型优化策略,低成本验证各种优化策略的模型效果。如图4所示,以PaddleDetection和PaddleOCR为例,套件中内置了大量的优化策略,支持从“数据增强→算法选择→部署工具”的全流程优化。
图4 开发套件全流程优化示意
提供训推一体的全链条功能支持
保障模型稳定、可靠
为了保障飞桨支持的模型在产业应用中稳定、可靠,飞桨提供了训推一体的全链条功能支持。在产业实践中,模型应用的研发流程可分解成:“模型选型、训练环境选型、模型压缩选型、部署工具和部署环境选型几个关键节点,如图5所示。飞桨产业模型库中的模型均已经在此链条中端到端验证,确保模型的使用稳定可靠。此外,图5也可以作为模型训练和推理部署的选型导航,为企业AI落地方案的整体选型提供参考。
图5 飞桨“训推一体”的全链条流程
2
飞桨产业范例库和
产业模型选型工具
上文介绍了在AI产业应用时,模型选择的方法和技巧。但是AI应用落地是个复杂的系统工程,只有模型并不能解决所有问题。例如安全帽检测的场景(安全要求比较高的厂房,需要检测员工是否有安全措施,可以应用深度学习技术实现佩戴安全帽检测,如图6所示),研发人员需要先进行数据采集与标注,然后把处理后的数据传输给机器学习的系统进行模型训练,最后将训练好的模型部署到真实的厂房环境上,这个流程需要对产线进行全面的升级改造。但是由于部署环境不同,如工厂环境、车间的设备差异较大,真正落地智能化改造也不是一件容易的事,常常都会需要3~6个月。
图6 AI应用落地流程示例
如何灵活运用这些模型和开发套件构建完整的落地方案,是企业在AI落地过程中急需解决的问题。为此,飞桨开源了产业实践范例库和飞桨产业模型选型工具,进一步降低了AI产业落地的难度。
飞桨产业实践范例库,直达项目落地
产业落地的“自动导航”
图7 飞桨产业实践范例库示例
点击文末阅读原文
获得飞桨产业范例库地址
https://aistudio.baidu.com/aistudio/topic/1000
产业模型选型工具
为用户推荐最合适应用落地“样板间”
目前飞桨产业范例库中包含了40+个范例,对于众多的AI产业落地项目,只覆盖了相对有限的高频场景,对于其他更广泛的AI应用,飞桨还设计并开源了产业模型选型工具。
如图8所示,飞桨产业模型选型工具凝聚了飞桨长期积累的产业实践经验,根据用户真实的产业落地诉求,对用户数据情况进行专业分析,推荐适合应用落地的模型与硬件组合。针对典型场景,还为用户自动关联呈现相关的产业实践范例。
图8 飞桨产业模型选型工具
飞桨产业模型选型工具体验地址:
3
面对复杂的AI产业落地场景
支持多个套件协同合作
AI产业应用往往比较复杂,一个独立的技术并不能完全解决实际问题。飞桨支持各开发套件之间协同应用,帮助用户高效解决真实场景中比较复杂的问题。如图9所示,以AI应用比较广泛的工业质检和语音播报场景为例,介绍开发套件的协同方案。
工业质检场景
在工业质检场景,用户会期望应用AI技术检测商品是否有瑕疵,并了解瑕疵的形状和大小,这是深度学习中的目标检测和图像分割任务,需要并行使用PaddleDetection和PaddleSeg解决;也有用户期望了解瑕疵的类型,如:划痕、油渍、斑点等,这就是目标检测和图像分类任务,需要并行使用PaddleDetection和PaddleClas解决。
语音播报场景
在语音播报场景,比较常见的是扫描笔(词典笔),用户扫描一段文字,扫描笔会自动识别文字内容,同步语音播报,实现“边扫、边读”,这就是深度学习中的OCR、文本纠错和语音合成任务,需要串行使用PaddleOCR、PaddleNLP和PaddleSpeech解决。
图9 多套件协同解决复杂的AI产业应用问题
4
飞桨产业级开源模型库
开源共建方案
正是由于飞桨产业模型库具备上述优秀的特性,截至2022年5月,飞桨已经累计服务18万家企事业单位,推动了人工智能技术、产业和生态的蓬勃发展。飞桨的每一步发展,都离不开广大开发者的支持和共同建设。
社区中的开发者共建飞桨产业级模型库的方式主要有两种:
论文复现
每个季度飞桨都会组织模型复现赛,欢迎开发者们参与,将最新的学术论文通过飞桨进行复现,加入到飞桨预训练算法和模型中;开发者会在这个过程中收获最新的论文思路和实践优化的技巧。
产业落地
产业落地有两个方向:一是基于训推一体的链条,将学术模型进行调优,达到模型的精度和性能平衡后,加入飞桨产业应用模型中;二是基于飞桨的模型库和开发套件,挖掘可落地的AI产业应用线索,并研发相应的灵活应用飞桨能力解决实际问题的完整方案,加入到飞桨产业实践范例库中。开发者会在这个过程中收获产业实践的一线能力,能够精通产业实践所必备的技能。
同时,在这些社区活动中,飞桨为开发者们提供了课程交流、赋能工具和奖金的支持。大家可以选择比较感兴趣的方向,加入到我们飞桨开源共建的队伍中。
图10 飞桨产业级开源模型库开源共建方案
了解更多
更多关于飞桨产业级开源模型库介绍的相关内容获取方式如下:
飞桨端到端套件官方文档:
https://www.paddlepaddle.org.cn/overview
飞桨一站式安装:
https://github.com/PaddlePaddle/PaddleCloud
飞桨产业模型选型工具:
https://www.paddlepaddle.org.cn/smrt
飞桨产业范例库:
https://aistudio.baidu.com/aistudio/topic/1000
模型库项目地址:
https://github.com/PaddlePaddle/models
https://gitee.com/PaddlePaddle/models
PP系列模型索引:
https://github.com/PaddlePaddle/models/blob/release/2.3/official/PP-Models.md
PP系列模型详细介绍
获取更多技术内容~