您现在的位置是:首页 >人工智能 > 2022-04-12 16:51:03 来源:

使用CLIP潜在的分层文本条件图像生成

导读 以前,针对文本条件图像生成问题提出了两种方法:CLIP等对比模型和扩散模型。最近,OpenAI为这项任务提出了一个新颖的系统:DALL·E2。这种

以前,针对文本条件图像生成问题提出了两种方法:CLIP等对比模型和扩散模型。最近,OpenAI为这项任务提出了一个新颖的系统:DALL·E2。

这种新方法可以生成更逼真、更准确的图像,其分辨率是其前身DALL·E的4倍。新颖的系统结合了两种先前的方法:训练扩散解码器以反转CLIP图像编码器。

除了从文本描述中创建原始、逼真的图像和艺术作品外,DALL·E2还可以对现有图像进行逼真的编辑,例如添加或删除元素。它甚至可以使用图像作为输入,并根据原始图像创建不同的变体。除了使人们能够创造性地表达自己之外,这项研究还帮助人类了解先进的人工智能系统如何看待和理解我们的世界。