DALL-E 3 的发布是人工智能图像生成领域最重要的事件之一。DALL-E 3 是来自 ChatGPT 创建者 OpenAI 的最新版图像生成器,现已在必应平台推出。DALL-E 3 与其前身 DALL-E 2 相比,大大提高了图像和文本解释能力,现在可在必应聊天和必应图像生成器中使用。
使用 DALL-E 3 可以做什么?
DALL-E 3 允许您生成不同类型的图像,您可以在设计过程中自由使用这些图像。您拥有使用 DALL-E 创建的图像的所有权,包括再版、销售和商品化的权利。
以下是我使用该工具生成图像的几个示例,以及我使用的提示:
使用 DALL-E 3 的理由?
既然我们已经有了 Midjourney 和 Stable Diffusion 这样强大的工具,为什么还要使用 DALL-E 3 呢?原因有三。
首先,DALL-E 3 是免费使用的;您无需支付任何费用即可使用该工具。必应提供每日积分,我们可以用它来生成图片。但好消息是,当我们用完所有的每日信用点数后,生成工作并不会停止,只是速度会变慢。
其次,DALL-E 3 能更好地完成特定任务,如在图像中添加文字和在同一图像中组合两个字符。
为图像添加文字
OpenAI 团队提到,该工具擅长为图片添加文字。
下面是一张手持我用该工具制作的文字标牌的照片。你可以注意到,文字并不总是那么完美,但总比 Midjourney 生成的文字要好。
在同一图像上组合两个字符
我曾用这个工具将蝙蝠侠和蜘蛛侠结合在同一幅插图中。有趣的是,《DALL-E 3》将蝙蝠侠和蜘蛛侠之间的对话定格成了一幅漫画。
集成在 ChatGPT 中
最后,DALL-E 3 的强大之处在于 OpenAI 将其集成到了 ChatGPT 中。通过使用 GPT 视觉模型分析 DALL-E 3 生成的图像并更改生成的图像,就可以在聊天中直接生成图像。
达利3》的缺点
该工具有一些缺点。图像生成过程现在有点慢,有时可能会出现错误信息,提示由于需求量大而无法生成图像。
另一个缺点是不能自定义图片。图像生成器提供了一个自定义选项,但它指向 Microsoft Designer,在那里你可以使用生成的图像作为提示的附加输入。在图像生成器中,您无法更改图像(例如,从画布中移除某些对象)或改变图像的宽高比。
原文:uxplanet