颠覆设计：新兴的人工智能工具是如何改变创造力的

Vivaldi 言: 2022年10月18日 8分钟阅读

几十年来，人工智能（AI）一直在发展，推动了聊天机器人和语音识别工具、无人驾驶汽车和机器人公民的发展。对于艺术家和设计师来说，无数新的数字工具已经影响了他们的创作方式，但人工智能的算法和自动化可能代表了该领域的巨大变化。

Vivaldi 创意总监约翰-阿迪在本问答中探讨了人工智能艺术带来的机遇、挑战和惊喜：

如果你必须给人工智能艺术一个快速的定义或描述，你会如何定义/描述它？

人工智能艺术是在人工智能的协助下创造的数字图像。在数百万张图片上训练的机器学习算法处理自然语言输入（提示），并生成它认为最符合文本的图像。从技术上讲，这被称为文本-图像模型。提示可以是非常简单的，比如：一只戴着高帽的小猫。 或者更复杂，如：一只戴着黑色高帽、穿着西装和领带的白色小猫的肖像，复古锡版照片。

左图：一只戴着高帽的猫。右图：一只戴着黑色高帽、穿着西装和领带的白色小猫的肖像，复古锡版照片

你的切入点是什么，或者说你是如何第一次发现AI艺术世界的？

我在我的一个品牌博客上看到一篇文章，有人用人工智能生成了一系列的插图图标。其保真度令人难以置信，我立即报名参加了OpenAI的Dall-E 2的beta测试，这也是原作者使用的。几周后，我收到了欢迎邮件，我被迷住了。

你最喜欢使用什么工具，为什么？

我从《Dall-E 2》开始，但很快就感觉到了用户界面的简单性所带来的限制。更不用说我不喜欢学分系统了。Dall-E要求你购买学分，每一个提示都要用一个学分。

今天，我几乎只使用Midjourney，它是一个基于Discord的生成器。除了通常能够创造出更高保真度的图像外，Midjourney还有各种工具和参数，我可以用来更好地引导人工智能达到我想要的结果。诸如：如何使图像超现实，长宽比，或人工智能应用的整体 "随机性"。Midjourney是按月订阅的，所以我可以生成无限的图像--在一些限制下--这对我的需求来说是更好的。

还有其他的工具，如稳定扩散，它是开源的。我还没有探索过那个工具。

这是《中游记》和《Dall-E 2》的对比。 (左二)一只戴高帽的猫(右二)一只戴黑色高帽、穿西装打领带的白色小猫的肖像，复古锡版照片

你觉得利用人工智能工具最令人兴奋的是什么？

我经常谈到这一点，但是，作为一个创意总监，使用人工智能艺术生成器就像在你的指尖上有数百万个有成就的艺术家和设计师。想让一张图片看起来像宫崎骏的插图吗？完成了。想知道约翰内斯-维米尔（Johannes Vermeer）画的星际驱逐舰会是什么样子吗？明白了。想知道如果扎哈-哈迪德受到耐克运动鞋的启发，她会设计什么样的建筑？我也可以告诉你。每一个曾经或拥有独特风格的伟大创作者都可以被挖掘出他们的视觉专长。

提示："Nike Zoom Rival Waffle运动鞋，建筑效果图，由扎哈-哈迪德建筑师设计的大曲线和详细的三角形图案窗户，外部建筑效果图广角，v-ray，电影4d"

我喜欢这个问题，因为它已经被问到了，用这么多的词，已经有几千年了。什么是艺术？谁是艺术家？什么工具和过程可以创造艺术？谁来决定？就像美在欣赏者的眼中一样，艺术也是如此。

我个人认为，艺术是任何表达某人的创作欲望的东西。

我认为由人工智能生成的单一图像本身就是艺术吗？不，但它可能是。这场对话中的泥泞区域是最引人注目的工作发生的地方。你可以很容易地生成一幅看起来像是由大师画的图像，但我认为最有趣的是那些让你问 "这可能是艺术吗？"的作品。

对于拥有更多传统技能的设计师，你认为这些工具将如何改变他们的工作方式？

文本到图像生成器将帮助所有类型的创作者更快地将其概念可视化。创作者将能够探索从未存在过的风格和主题的组合。而最重要的是，图像将不会受到他们自身经验的限制。人工智能可以超越人类思维，对最疯狂的概念进行最好的尝试。把它看作是一种走出你自己的头脑，更客观地看待你想要创造的东西的方式。

围绕着人工智能艺术的发展，有许多法律和伦理方面的挑战--你对这些挑战必须如何解决有什么想法吗？

我看到的第一大问题（来自艺术界）是版权和剽窃。由于很容易产生别人风格的东西，许多人认为这是一个剽窃的灰色地带。虽然我认为这是一个合理的担忧，但任何争议都将在个案的基础上处理，就像 "常规 "艺术冲突一样。

也有所有权问题。根据Midjourney的服务条款，Midjourney和用户都拥有所创作图片的全部权利。这意味着有人可以把他们的艺术作品放在T恤衫上出售，但Midjourney也可以--而且双方都没有任何法律权利告诉对方停止。另一方面，Dall-E 2拥有用户创造的所有东西，没有所有权给用户。

有人获得了第一个已知的人工智能生成产品的版权--一本平面小说。然而，问题仍然存在：如果小说本身是有版权的，那么人工智能生成的每一块插图也是如此吗？

在道德方面，我从整个世界上看到的最大担忧是深层假货。深度伪造是名人或公众人物的媒体，看起来很真实，但由人工智能生成。其影响可能是可怕的，特别是对政治家和世界领导人。人们可能被生成处于妥协的位置，或者当涉及到人工智能视频和语音生成器时，说着他们从未说过的话。

在这些根据丽莎-弗兰克风格创作的肖像画中，你可以看到米德杰尼在再现名人和公众人物的肖像方面是多么出色。

你认为人工智能是如何推动创意世界的？

一个艺术家掌握的工具越多越好!就像任何新工具一样，你必须学会如何使用它--也许会成为它的专家。对于一件严肃的作品，我将花上两个小时以上的时间来完善提示，并尝试一堆不同的词语组合、风格和技术参数。学习曲线并不那么陡峭，但它仍然是一个令人满意的将我的创造力投入工作的新方法。

人们在日常的创意工作流中也在使用人工智能。一些艺术家生成了一堆图像，然后把最好的部分用照片合成。另一些人则使用一种叫做 "覆盖画 "的技术，也就是他们利用人工智能生成的构图，然后在上面应用自己的风格。他们通过让人工智能在照明、规模和比例方面做第一次尝试来节省时间，这样他们就可以专注于风格、颜色和完善主题。

另一个巨大的好处是越来越多的人通过这些工具了解艺术家和艺术史。那些可能从未考虑过谁是约翰内斯-维米尔或阿尔布雷希特-丢勒的人，现在正在寻找那些能与他们脑海中的风格相匹配的艺术家。我经常通过谷歌搜索 "著名的[空白]艺术家 "来发现新的艺术家，其中空白是一种特定的媒体或风格，例如雕刻或印象主义。此外，我还从阅读其他人的提示中了解新的艺术家。

我确信，随着这些工具的民主化和更容易使用，我们将看到每个人对待图像创作的方式的转变--类似于高清摄影和视频被智能手机民主化的方式。也许那些一直有远见，但缺乏艺术技能来实现它的人将被赋予权力，最终通过人工智能将他们的想法变为现实。

你能分享一下你所创造的一些不同的东西，也许可以用一两句话来说明你用什么工具来创造它，以及你在创造过程中的想法/思路是什么？

Midjourney官方Facebook页面最近举行了他们的第一次社区竞赛，主题是 "幻想建筑"。有500多份参赛作品，而我最终以这个等距水晶建筑获得了第一名。不管是什么原因，我经常被水晶和多彩的光线折射所吸引。再加上我对MC埃舍尔和纪念碑谷视频游戏的喜爱，我们就在这里结束了。在Midjourney比赛中对图片进行照片处理是违反规定的，所以这些图片完全没有经过编辑。

从左到右：原始的几代人到迭代到最终的艺术品。
提示：由豪华水晶制成的水晶城堡，百家乐施华洛世奇，窗户，门，灯，在一个神秘的森林里，水手月牙，粉红色的柔和光芒，::MC Escher::2，等距，神秘的闪亮-ar 2:3

还有什么要补充/提及的吗？

现在就去报名参加Dall-E 2!他们刚刚取消了等待名单。你每个月的前15个学分是免费的。还可以查看公共的Midjourney feed，以了解这几代人可以有多大变化。

人们在哪里可以找到你的一些AI艺术作品？

你可以在Instagram上关注我，网址是crystal_aesthetic.ai，也可以在LinkedIn上关注我。如果你有问题或想聊天，请联系我!