提供全面丰富的中文处理任务,涵盖了文本分类、序列标注、语义表示、语义匹配等多种NLP任务,可根据业务需求或实验需求快速选择合适的预训练模型进行使用。
基于PaddlePaddle深度学习框架构建的基础NLP网络和NLP应用任务的灵活解耦,网络可灵活调整,场景可高效迁移,真正高效易用。
拥有当前业内效果最好的中文语义表示模型和基于用户大数据训练的应⽤任务模型,模型效果调整机制源于产业实践,效果更突出。
词法分析是一个联合的词法分析模型,能够整体性地完成中文分词、词性标注、专名识别的任务。百度词法分析基于一个堆叠的双向GRU结构,在长文本上准确复刻了百度AI开放平台上的词法分析算法。适用于语音指令解析、多轮交互式搜索、实体数据库构建等场景。
文本情感分类是目前最好的中文情感分析模型,可自动判断中文文本的情感极性类别并给出相应的置信度。情感类型分为积极、消极、 中性。情感倾向分析能够帮助企业理解用户消费习惯、分析热点话题和危机舆情监控,为企业提供有力的决策支持。
对话情绪识别专注于识别智能对话场景中用户的情绪,针对智能对话场景中的用户文本自动判断该文本的情绪类别并给出相应的置信度,情绪类型分为积极、消极、中性。对话情绪识别适用于聊天、客服等多个场景,能够帮助企业更好地把握对话质量、改善产品的用户交互体验。
分类组网集
可用于文本分类的深度学习网络结构,输入为文本中每个字、词的ID,输出为文本属于各个类别的概率。包括:BOW、CNN、GRU、LSTM、BiLSTM。
PaddlePaddle的安装与配置
请您在PaddlePaddle官方网站,找到“快速安装”部分,根据您机器环境情况,选择对应的配置选项,然后按照PaddlePaddle官网的安装教程,安装PaddlePaddle。
NLP工具集的安装与配置
克隆GitHub上的工具集到本地,然后进入到任务所在路径。