一文全面了解 DALL·E 2 AI 图像生成器

由 OpenAI 开发的 DALL·E 2 可以说是目前 AI 图像生成技术的顶级代表。在这篇文章中，我们将从 DALL·E 2 的功能、易用性、自定义选项、价格以及图像生成质量等方面对其做一个深度了解。

什么是 DALL·E?
如何使用 DALL·E 2?
DALL·E 2 的自定义选项
DALL·E 2 生成图像的质量
DALL·E 2 的价格
总结

什么是 DALL·E？

DALL·E 是一种基于 AI 的图像生成器，利用深度学习算法，可根据输入的文本生成独特且逼真的图片。经过大量图片及图片所对应的文本描述的数据训练，DALL·E 能够理解文本和可视化之间的关系。DALL·E 可根据用户的文本输入生成涵盖日常事物到抽象概念等各种图片。

易用性

DALL·E 2 的用户界面设计还挺直观的。当你通过 https://labs.openai.com/ 来到 DALL·E 2 的界面，你会看到一个文本输入框。输入你想要图片的特征、属性、场景等信息，回车 DALL·E 2 就开始了生成，几秒钟后你就会得到结果图片（ 4 个图片变体供你选择）。如果你对结果图片满意，可点击图片右上角的下载按钮保存到本地使用。如果结果图片不符合你的预期，你可输入更详细的文本命令要求 DALL·E 2 重新生成，或者通过 DALL·E 2 提供的一系列自定义选项来调整生成图像的各个方面。在界面上寻找相关的控件或滑块，通过调整颜色、形状、纹理、透视和风格等参数来改变图像的外观和风格。

控制与自定义选项

DALL·E 2 提供了一系列的自定义选项，包括 Out-painting (外部绘制) 和 In-painting (内部绘制)。通过 Out-painting, 用户可以将图像扩展到超过初始文本命令的范围，而 In-painting 则允许对生成图像中的特定元素进行修改或删除。这些选项与颜色、形状、纹理、透视和风格等广泛控制结合在一起，为用户提供了创作自由。而用户的这些微调动作，也会促进 DALL·E 2 的学习和迭代。

生成图像的质量

DALL·E 2 经过大规模数据集的训练，对构图、光照和纹理有着敏锐的理解，生成高质量图片的能力是毋庸置疑的。但需要你提供详尽具体的文本命令，输入的文本要求越具体，获得高质量的图片输出的可能性就越高。DALL·E 2 也有不足的地方，例如它非常不擅长对视觉元素（如形状、方向、颜色）进行组合，组合后的结果往往是没有连贯性和逻辑性。另外，它偶尔也会出现对文本命令的错误解读，生成让人摸不着头脑的图片。

一张 DALL·E 2 生成的年轻女子照片，蓝色的眼睛和金色的头发

定价

DALL·E 2 注册时会送 50 个免费积分，另外每个月会额外送 15 个免费积分。每个积分可以进行一次文本命令输入生成 4 个图片变体。你也可以购买积分，售价为 15 美元 115 个积分，相当于每次文本命令输入为 0.13 美元，每个图片变体 0.03 美元。这种价格结构兼顾了尝新用户和深度用户，还是非常合理的。

总结：DALL-E 2 完美吗？作为一个正在进行中的项目，答案是否定的。但是，正如机器学习的本质一样，该程序随着时间的推移变得越来越智能和胜任。从纯粹的技术角度来看，DALL-E 2 是人工智能技术发展的一大步。目前大多数人还是认为人工智能在创意领域是无法超越人类的，但是未来实在是不好说。