本系列根据WAVE SUMMIT+ 2022深度学习开发者峰会「AI大模型 智领未来」论坛嘉宾分享整理。文章整理自百度杰出研发架构师肖欣延的主题分享——AI作画:文心一格赋能艺术与设计创作。
创作需求理解,即如何准确地理解用户需求,降低用户输入描述的难度。
图像原创生成,即如何支持用户艺术、写实等多样化的画作生成需求。
创作需求满足,即如何对生成结果优化,高质量满足用户创作需求。
基于知识的Prompt学习。对用户输入的文字,通过自动创意规划,能够大幅提升易用性。
文本跨模深度融合的文生图。在图像生成中,通过文本和跨模态的深度融合,模型兼具整体复杂构图和局部细节刻画能力。
文本驱动的图像编辑。通过文本驱动的图像编辑,允许用户进行多轮交互,提升画作质量。
Prompt自动学习
文心一格基于知识的理解与扩充,大幅提升易用性。首先,当用户输入一个文本Query,文心一格通过面向Prompt工程的Query理解,能够进行多角度识别,进而根据识别结果进行扩充,把整个描述丰富化,包括风格、构图、视觉要素等。同时,这两个过程也可以通过端到端生成实现,这里,两种方式都是基于知识图谱得以实现。最后,文心一格通过Prompt排序获得比较好的Prompt,再输入给文生图环节,最终生成精美的AI画作图片。
统一图像生成
统一图像编辑
在图像生成后,有时生成结果可能不尽人意,用户会希望对图片进行一定修改。对此,文心一格也支持文本驱动的图到图生成。下图左侧是模型效果,通过引入对输入文本的注意力机制,就能够让扩散生成模型更加关注用户希望修改的部分,实现图像的二次生成和创作。文心一格具有三种编辑能力:一是元素修改,即对一幅图像的局部进行修改;二是实现风格转化与迁移;三是进行相似图的二次生成。
文心一格网址
https://yige.baidu.com/
本系列根据WAVE SUMMIT+ 2022深度学习开发者峰会「AI大模型 智领未来」论坛嘉宾分享整理。文章整理自百度杰出研发架构师肖欣延的主题分享——AI作画:文心一格赋能艺术与设计创作。
创作需求理解,即如何准确地理解用户需求,降低用户输入描述的难度。
图像原创生成,即如何支持用户艺术、写实等多样化的画作生成需求。
创作需求满足,即如何对生成结果优化,高质量满足用户创作需求。
基于知识的Prompt学习。对用户输入的文字,通过自动创意规划,能够大幅提升易用性。
文本跨模深度融合的文生图。在图像生成中,通过文本和跨模态的深度融合,模型兼具整体复杂构图和局部细节刻画能力。
文本驱动的图像编辑。通过文本驱动的图像编辑,允许用户进行多轮交互,提升画作质量。
Prompt自动学习
文心一格基于知识的理解与扩充,大幅提升易用性。首先,当用户输入一个文本Query,文心一格通过面向Prompt工程的Query理解,能够进行多角度识别,进而根据识别结果进行扩充,把整个描述丰富化,包括风格、构图、视觉要素等。同时,这两个过程也可以通过端到端生成实现,这里,两种方式都是基于知识图谱得以实现。最后,文心一格通过Prompt排序获得比较好的Prompt,再输入给文生图环节,最终生成精美的AI画作图片。
统一图像生成
统一图像编辑
在图像生成后,有时生成结果可能不尽人意,用户会希望对图片进行一定修改。对此,文心一格也支持文本驱动的图到图生成。下图左侧是模型效果,通过引入对输入文本的注意力机制,就能够让扩散生成模型更加关注用户希望修改的部分,实现图像的二次生成和创作。文心一格具有三种编辑能力:一是元素修改,即对一幅图像的局部进行修改;二是实现风格转化与迁移;三是进行相似图的二次生成。
文心一格网址
https://yige.baidu.com/