在医疗行为开展的过程中,存在辨明药品禁忌症、了解不良反应、明确配伍禁忌和调整用药方式等实际需求,市面现有产品的功能较为单一、应用范围窄、数据更新慢无法满足业务需求,例如:药店场景SKU管理(Stock Keeping Unit,库存保有单位)要求数据标准化且更新频率高;在处方流转中,医院、药房、药店有审方需求。广州中康数字科技有限公司将这些需求转化为基于自然语言处理的药品说明书自动结构化问题,使用飞桨PaddleNLP解决数据处理问题,并形成药品知识图谱,衍生出合理用药提示、不良反应监测、推荐用药等应用。
中康科技通过探索海量文本与图像知识结构化处理、分析药品信息结构,并结合人工智能技术,形成药品知识图谱,并以此为基础进一步研究构建泛医行业应用。使用ERNIE-UIE和ERNIE-Health进行药品说明书的信息抽取和知识图谱构建,并嵌入到中康数字科技自研的医学垂直领域标注平台Sinotation中进行自动化标注和自主学习,提升标注效率和标准质量。本项目还实现自动化抽取药品说明书数据并对齐到医学标准术语库,包括SNOMED CT、UMLS 等,扩展图谱内容,形成药品知识图谱,衍生出合理用药提示服务、不良反应监测、用药推荐助手、药品说明书结构化等应用,填补了客户需求空白,解决人工效率低下问题。
系统上线后,提升了信息抽取的准确性,医学知识图谱的F1值从0.86上升到0.90左右。基于ERNIE-Health预训练模型效果提升2~3个点,基于ERNIE-Health模型初始化医学语料预测训练,可提升1~2 个点。
3月28日晚8:30,中康科技资深算法工程师梁锐老师将作客飞桨直播间,分享基于大模型的医学文本信息处理与抽取产业落地经验。
基于UIE抽取信息,提升数据标准质量
基于ERNIE-Health进行Fine-tune,提升下游任务模型的准确率
通用信息抽取 UIE (Universal Information Extraction)
ERNIE-Health
使用医疗领域预训练模型Fine-tune 完成中文医疗语言理解任务
在医疗行为开展的过程中,存在辨明药品禁忌症、了解不良反应、明确配伍禁忌和调整用药方式等实际需求,市面现有产品的功能较为单一、应用范围窄、数据更新慢无法满足业务需求,例如:药店场景SKU管理(Stock Keeping Unit,库存保有单位)要求数据标准化且更新频率高;在处方流转中,医院、药房、药店有审方需求。广州中康数字科技有限公司将这些需求转化为基于自然语言处理的药品说明书自动结构化问题,使用飞桨PaddleNLP解决数据处理问题,并形成药品知识图谱,衍生出合理用药提示、不良反应监测、推荐用药等应用。
中康科技通过探索海量文本与图像知识结构化处理、分析药品信息结构,并结合人工智能技术,形成药品知识图谱,并以此为基础进一步研究构建泛医行业应用。使用ERNIE-UIE和ERNIE-Health进行药品说明书的信息抽取和知识图谱构建,并嵌入到中康数字科技自研的医学垂直领域标注平台Sinotation中进行自动化标注和自主学习,提升标注效率和标准质量。本项目还实现自动化抽取药品说明书数据并对齐到医学标准术语库,包括SNOMED CT、UMLS 等,扩展图谱内容,形成药品知识图谱,衍生出合理用药提示服务、不良反应监测、用药推荐助手、药品说明书结构化等应用,填补了客户需求空白,解决人工效率低下问题。
系统上线后,提升了信息抽取的准确性,医学知识图谱的F1值从0.86上升到0.90左右。基于ERNIE-Health预训练模型效果提升2~3个点,基于ERNIE-Health模型初始化医学语料预测训练,可提升1~2 个点。
3月28日晚8:30,中康科技资深算法工程师梁锐老师将作客飞桨直播间,分享基于大模型的医学文本信息处理与抽取产业落地经验。
基于UIE抽取信息,提升数据标准质量
基于ERNIE-Health进行Fine-tune,提升下游任务模型的准确率
通用信息抽取 UIE (Universal Information Extraction)
ERNIE-Health
使用医疗领域预训练模型Fine-tune 完成中文医疗语言理解任务