一年一度的国内顶尖艺术院校的毕业展,成为最值得期待的中国艺术新兴力量们的展示舞台。在今年6月初,初出茅庐的“AI画家”度晓晓创作的AI绘画数字藏品卖出了超过17万元的高价。而她售卖的四幅画作,平均只需数十秒就能完成,极大展现了百度飞桨文心大模型的AIGC(AI Generated Content)能力。
近日,百度数字人度晓晓带着她的画作“现身”西安美术学院2022年“时空留痕·无界西美”本科毕业展,开设专属展区,被美院教授评价为 “已经达到了本科美术生的基本要求”。
1
从一段话到一幅画
跨模态生成能力尽显
度晓晓此次展出的“无界”系列六幅高清艺术画作在展览现场吸引不少观展者驻足欣赏。围绕展览主题,度晓晓创作了“无界”系列画作,《自然与虚拟》、《火星上的月亮》、《沙漠中的孤岛》、《颜色与星空》四幅作品,分别诠释了生灵、自然、宇宙和色彩之间的“无界”,尽显丰富的想象力和独特的艺术审美。与此同时,在百度飞桨文心大模型的支持下,度晓晓每幅作品的创作时间仅需数十秒。
此外,度晓晓还以西安著名的大慈恩寺雁塔为素材,创作了两幅作品。一幅是落日熔金,鸿雁北归,慈恩寺内长明的油灯与嗒嗒的木鱼声相伴千年,展现的是文明的无界。另一幅是百年之树木与林立的高楼互相碰撞,新生的飞鸟绕着古老的佛寺滑翔。现代化都市与伫立千百年的雁塔互相依偎,展现的是时光的无界。
仅仅需要输入一段语言描述,AI系统就可以在数十秒内生成一幅高清艺术画作,充满想象力的构图、流畅的笔触和丰富的色彩无不彰显着独特的艺术审美。文心大模型不仅能让AI根据需求画出多样场景,还能博采众长,实现水彩、油画、水墨画、印象派等多种风格。
和高考作文写作一样,度晓晓“无界”系列画作背后,体现的是百度产业级深度学习平台飞桨以及产业级知识增强大模型文心的强大技术实力。度晓晓创作的“无界”系列作品使用了文心大模型跨模态图文生成模型ERNIE-ViLG,它具备了领先的跨模态理解和生成能力。
让机器具备跨越文本、图像等多种模态的跨模态生成能力是人工智能的重要目标之一,也是一种为艺术创作、虚拟现实、虚拟数字人等领域的未来发展提供无限可能的原动力。以艺术创作为例,首先,AI要对人们输入文字的含义进行深度理解,结合背景知识在给定文字上进一步扩展,再根据扩充后形成的丰富信息搜寻契合的元素,进而产生创作的“灵感”;然后,AI将“灵感”落实初步落实为草图,再进行优化填充,逐渐调整为切合主题的高质量图片。
除了艺术创作外,度晓晓创作“无界”系列作品使用的文心跨模态图文生成大模型ERNIE-ViLG更是一种图像-文本双向生成模型,它通过自回归生成模式对图像生成和文本生成任务进行统一建模,更好地捕捉模态间的语义对齐关系,同时提升图文双向生成任务的效果。也就是说,使用ERNIE-ViLG不仅可以根据个性化需求自动化生成油画、水彩画、中国画等多种风格的不同分辨率图像,还能实现“看图说话”的效果。
2
文心大模型助力智能创作
推动AIGC时代到来
AI技术不断迭代之下,除UGC、PGC以外的一种利用AI自动生成内容的新型生产方式——AIGC已悄然走进我们的生活。百度研究院在今年初发布的科技趋势预测中提到,2022年AIGC借助大模型的跨模态综合技术能力,可以激发创意,提升内容多样性,降低制作成本,将实现大规模应用。度晓晓在挑战高考作文写作中的表现更是让媒体感受到“AIGC元年已至”。
AI在艺术领域的学习与创作能力正在颠覆我们的认知,也让公众对科技与艺术的融合创新有了更大的想象空间。百度全新推出的基于文心大模型的创意社区——文心·旸谷社区,希望让更多用户可以零距离感受到文心大模型的魅力和应用创新潜力,迸发出更多富有想象力的新事物。未来,基于文心大模型的AIGC将会带来更多新的创新性探索,并开放赋能到更多的内容生产领域。
欢迎体验
更多阅读
关注【飞桨PaddlePaddle】公众号