图像分割是计算机视觉三大任务之一,基于深度学习的图像分割技术也发挥日益重要的作用,广泛应用于智慧医疗、工业质检、自动驾驶、遥感、智能办公等行业。
开源NeurIPS 2022顶会发表的语义分割官方实现模型RTFormer,结合CNN和Transformer的优点,该模型设计并使用了高效的RTFormer Block。对比其他实时语义分割模型,RTFormer在多个数据集上实现SOTA精度和速度。(后续会有单独文章详细解读)
技术升级详细解析
第一部分
通用场景的智能标注
医疗、遥感垂类场景的智能标注
EISeg针对特定数据集进行训练并获得了高质量的交互式分割模型,目前覆盖的场景包括: 医疗腹腔多器官、椎骨分割、产品瑕疵分割、遥感建筑物分割等。同时,针对不同场景的标注需求,EISeg提供了相应的特色标注能力,比如遥感图像支持遥感信息的读取,医疗图像支持窗宽窗位的选择等,从而拓展了交互式分割的应用领域。
业界领先的内置分割模型
支持视频智能标注
EISeg正式版视频标注工具以交互式分割算法及交互式视频分割算法MiVOS为基础,涵盖了通用、腹腔多器官,CT椎骨等不同方向的高质量交互式视频分割模型,方便开发者快速实现视频的分割标注。
支持多种图像及标注格式
助力多家标注平台落地
第二部分
开源PP-HumanSeg14K人像分割数据集
标注的图片
升级实时高精度人像分割SOTA模型
对于模型Encoder部分,考虑到模型的算量要求很高,我们选用MobileNetV3作为骨干网络提取多层特征。分析发现MobileNetV3的参数主要集中在最后一个Stage,在不影响分割精度的前提下,我们只保留MobileNetV3的前四个Stage,成功减少了68.6%的参数量。对于上下文部分,我们使用PP-LiteSeg模型中提出的轻量级SPPM模块,而且其中的普通卷积都替换为可分离卷积,进一步减小计算量。SPPM模块输入16倍下采样特征图,输出汇集全局上下文信息的特征图。对于Decoder部分,我们设计三个Fusion融合模块,多次融合深层语义特征和浅层细节特征,最后一个Fusion融合模块再次汇集不同层次的特征图,输出分割结果。
三个关键优化策略升级
调整图像分辨率,提升推理速度
https://github.com/PaddlePaddle/PaddleSeg/tree/release/2.6/contrib/PP-HumanSeg
第三部分
基于自研模型的3D智能标注平台EISeg-Med3D
极大丰富的高精度多器官前沿模型
从v1到v2,MedicalSeg的内置分割算法从单个VNet丰富到6个SOTA算法,扩充的模型数量提供了更为先进高效的分割性能,覆盖了18种各类器官组织。如下表所示,复现的模型对比原始算法精度均有不同精度的提升,其中TransUNet相比原始算法精度提升了3.6。
定制化医疗分割方案nnUNet
加入PaddleSeg
技术交流群
入群福利
1. PaddleSeg历次发版直播课视频
2. 社区优秀开发者项目分享视频
入群方式
PaddleSeg
技术分享直播课
相关地址
官网地址
https://www.paddlepaddle.org.cn
PaddleSeg项目地址(GitHub)
https://github.com/PaddlePaddle/PaddleSeg
图像分割是计算机视觉三大任务之一,基于深度学习的图像分割技术也发挥日益重要的作用,广泛应用于智慧医疗、工业质检、自动驾驶、遥感、智能办公等行业。
开源NeurIPS 2022顶会发表的语义分割官方实现模型RTFormer,结合CNN和Transformer的优点,该模型设计并使用了高效的RTFormer Block。对比其他实时语义分割模型,RTFormer在多个数据集上实现SOTA精度和速度。(后续会有单独文章详细解读)
技术升级详细解析
第一部分
通用场景的智能标注
医疗、遥感垂类场景的智能标注
EISeg针对特定数据集进行训练并获得了高质量的交互式分割模型,目前覆盖的场景包括: 医疗腹腔多器官、椎骨分割、产品瑕疵分割、遥感建筑物分割等。同时,针对不同场景的标注需求,EISeg提供了相应的特色标注能力,比如遥感图像支持遥感信息的读取,医疗图像支持窗宽窗位的选择等,从而拓展了交互式分割的应用领域。
业界领先的内置分割模型
支持视频智能标注
EISeg正式版视频标注工具以交互式分割算法及交互式视频分割算法MiVOS为基础,涵盖了通用、腹腔多器官,CT椎骨等不同方向的高质量交互式视频分割模型,方便开发者快速实现视频的分割标注。
支持多种图像及标注格式
助力多家标注平台落地
第二部分
开源PP-HumanSeg14K人像分割数据集
标注的图片
升级实时高精度人像分割SOTA模型
对于模型Encoder部分,考虑到模型的算量要求很高,我们选用MobileNetV3作为骨干网络提取多层特征。分析发现MobileNetV3的参数主要集中在最后一个Stage,在不影响分割精度的前提下,我们只保留MobileNetV3的前四个Stage,成功减少了68.6%的参数量。对于上下文部分,我们使用PP-LiteSeg模型中提出的轻量级SPPM模块,而且其中的普通卷积都替换为可分离卷积,进一步减小计算量。SPPM模块输入16倍下采样特征图,输出汇集全局上下文信息的特征图。对于Decoder部分,我们设计三个Fusion融合模块,多次融合深层语义特征和浅层细节特征,最后一个Fusion融合模块再次汇集不同层次的特征图,输出分割结果。
三个关键优化策略升级
调整图像分辨率,提升推理速度
https://github.com/PaddlePaddle/PaddleSeg/tree/release/2.6/contrib/PP-HumanSeg
第三部分
基于自研模型的3D智能标注平台EISeg-Med3D
极大丰富的高精度多器官前沿模型
从v1到v2,MedicalSeg的内置分割算法从单个VNet丰富到6个SOTA算法,扩充的模型数量提供了更为先进高效的分割性能,覆盖了18种各类器官组织。如下表所示,复现的模型对比原始算法精度均有不同精度的提升,其中TransUNet相比原始算法精度提升了3.6。
定制化医疗分割方案nnUNet
加入PaddleSeg
技术交流群
入群福利
1. PaddleSeg历次发版直播课视频
2. 社区优秀开发者项目分享视频
入群方式
PaddleSeg
技术分享直播课
相关地址
官网地址
https://www.paddlepaddle.org.cn
PaddleSeg项目地址(GitHub)
https://github.com/PaddlePaddle/PaddleSeg