一文全面了解 DALL·E 2 AI 图像生成器

由 OpenAI 开发的 DALL·E 2 可以说是目前 AI 图像生成技术的顶级代表。在这篇文章中,我们将从 DALL·E 2 的功能、易用性、自定义选项、价格以及图像生成质量等方面对其做一个深度了解。

什么是 DALL·E?

DALL·E 是一种基于 AI 的图像生成器,利用深度学习算法,可根据输入的文本生成独特且逼真的图片。经过大量图片及图片所对应的文本描述的数据训练,DALL·E 能够理解文本和可视化之间的关系。DALL·E 可根据用户的文本输入生成涵盖日常事物到抽象概念等各种图片。

易用性

DALL·E 2 的用户界面设计还挺直观的。当你通过 https://labs.openai.com/ 来到 DALL·E 2 的界面,你会看到一个文本输入框。输入你想要图片的特征、属性、场景等信息,回车 DALL·E 2 就开始了生成,几秒钟后你就会得到结果图片( 4 个图片变体供你选择 )。如果你对结果图片满意,可点击图片右上角的下载按钮保存到本地使用。如果结果图片不符合你的预期,你可输入更详细的文本命令要求 DALL·E 2 重新生成,或者通过 DALL·E 2 提供的一系列自定义选项来调整生成图像的各个方面。在界面上寻找相关的控件或滑块,通过调整颜色、形状、纹理、透视和风格等参数来改变图像的外观和风格。

控制与自定义选项

DALL·E 2 提供了一系列的自定义选项,包括 Out-painting (外部绘制) 和 In-painting (内部绘制)。通过 Out-painting, 用户可以将图像扩展到超过初始文本命令的范围,而 In-painting 则允许对生成图像中的特定元素进行修改或删除。这些选项与颜色、形状、纹理、透视和风格等广泛控制结合在一起,为用户提供了创作自由。而用户的这些微调动作,也会促进 DALL·E 2 的学习和迭代。

生成图像的质量

DALL·E 2 经过大规模数据集的训练,对构图、光照和纹理有着敏锐的理解,生成高质量图片的能力是毋庸置疑的。但需要你提供详尽具体的文本命令,输入的文本要求越具体,获得高质量的图片输出的可能性就越高。DALL·E 2 也有不足的地方,例如它非常不擅长对视觉元素(如形状、方向、颜色)进行组合,组合后的结果往往是没有连贯性和逻辑性。另外,它偶尔也会出现对文本命令的错误解读,生成让人摸不着头脑的图片。

一张 DALL·E 2 生成的年轻女子照片,蓝色的眼睛和金色的头发

定价

DALL·E 2 注册时会送 50 个免费积分,另外每个月会额外送 15 个免费积分。每个积分可以进行一次文本命令输入生成 4 个图片变体。你也可以购买积分,售价为 15 美元 115 个积分,相当于每次文本命令输入为 0.13 美元,每个图片变体 0.03 美元。这种价格结构兼顾了尝新用户和深度用户,还是非常合理的。

总结:DALL-E 2 完美吗?作为一个正在进行中的项目,答案是否定的。但是,正如机器学习的本质一样,该程序随着时间的推移变得越来越智能和胜任。从纯粹的技术角度来看,DALL-E 2 是人工智能技术发展的一大步。目前大多数人还是认为人工智能在创意领域是无法超越人类的,但是未来实在是不好说。

Ethan Chen
  • Ethan Chen
  • 作为一位科技爱好者,Ethan 对所有与科技相关的事物充满热情,不断寻找最新的科技硬件、软件、新兴技术,突破可行性的界限,揭示无限的可能性。