赛题背景及事实一致性简介
结果A(事实一致):研究机构预计国际金价近涨远跌
结果B(事实不一致):分析师:金价2018年或跌至1800美元
赛程安排
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
阶段1:开放测试集1,参赛队伍可在测试集1上优化模型效果,提交结果到千言平台后,会在线给出结果并更新实时榜单1;
阶段2-最终测试提交:开放测试集2,参赛队伍计算测试集2上的结果并提交到千言平台;
阶段3-人工评估:以阶段2的自动评测结果为准,排名前10的队伍进入人工评估阶段,为避免自动评估指标本身的评估偏差,将以人工评估为依据确认和公布最终排名。
参赛奖励
(1)丰厚奖金:第一名20000人民币、第二名10000人民币、第三名5000人民币。
(2)荣誉证书:获奖团队将由赛事主办方颁发权威获奖证书。
学习交流机会:在赛事群中与参赛者、组织者深入交流;
前沿学习资料:获取自然语言生成事实准确性提升方法和评估指标的前沿进展学习材料。
精美礼品&参赛证明:正式报名参赛并提交最终结果的队伍每位成员将获得千言数据集精美的定制周边一份,并发放参赛证明。
比赛组织
指导单位:中国中文信息学会
主办单位:中国中文信息学会自然语言生成专委会(筹)
承办单位:清华大学、哈尔滨工业大学(深圳)、百度
评测委员会:黄民烈(清华大学), 户保田(哈尔滨工业大学(深圳))、肖欣延(百度)
交流群
添加竞赛小助手,备注“NLG”即可加入赛事交流群。
参考文献
[1] Zhihong Shao, Minlie Huang, Jiangtao Wen, Wenfei Xu, Xiaoyan Zhu. 2019. Long and Diverse Text Generation with Planning-based Hierarchical Variational Model. In Proceedings of EMNLP 2019.
[2] Baotian Hu, Qingcai Chen, Fangze Zhu. 2015. LCSTS: A Large Scale Chinese Short Text Summarization Dataset. In Proceedings of EMNLP 2015.
[3] Wei He, Kai Liu, Jing Liu, Yajuan Lyu, Shiqi Zhao, Xinyan Xiao, Yuan Liu, Yizhong Wang, Hua Wu, Qiaoqiao She, Xuan Liu, Tian Wu, Haifeng Wang. 2019. DuReader: a Chinese Machine Reading Comprehension Dataset from Real-world Applications. In Proceedings of ACL 2018 MRQA Workshop.
飞桨(PaddlePaddle)以百度多年的深度学习技术研究和业务应用为基础,集深度学习核心训练和推理框架、基础模型库、端到端开发套件和丰富的工具组件于一体,是中国首个自主研发、功能丰富、开源开放的产业级深度学习平台。飞桨企业版针对企业级需求增强了相应特性,包含零门槛AI开发平台EasyDL和全功能AI开发平台BML。EasyDL主要面向中小企业,提供零门槛、预置丰富网络和模型、便捷高效的开发平台;BML是为大型企业提供的功能全面、可灵活定制和被深度集成的开发平台。
END