占领互联网的最新工具是一种强大的人工智能图像生成器,它让许多创意人士目瞪口呆。
你可能已经看到了最流行的接管潮流。。。好吧,我想是推特吧。这个工具在概念上相当简单--用户输入两个描述性的单词或短语,理应是两个截然不同的主题和想法。想想达斯·维达和小猫或者壮志凌云。。。一些蹩脚的东西。该工具将两个短语或想法组合在一起,并创建将两者变形在一起的单独图像,从而创建一个原始图像。可以把它想象成自动PS。
很容易看出这样的事情会如何发展。喜剧配对和令人震惊的图像注定会走红的机会无穷无尽。
那么这个工具是如何工作的,是谁创建的,以及我们未来可以从这些类型的应用程序中看到什么
它怎麽工作
目前,你在社交媒体上看到的最受欢迎的应用程序是“Dall-E mini”。它创建了9个区块的图像集,带有相同奇怪外观主题的变化。结果是非常扭曲的,所以他们不是超现实的。它们看起来就像奇怪的图画。。。差不多了。
9图像块是Dall-E mini的标准输出。每一部都是同一主题的变种。
Dall-E由非营利性人工智能研究机构OpenAI(由埃隆·马斯克共同创立)开发,是GPT-3(生成性预训练变压器)的多模式实现,具有120亿个参数,该参数“将文本交换为像素”。该工具是针对互联网上的“文本-图像对”进行训练的。因此,基本上,它只是非常迅速地在互联网上搜索,将短语与图像联系起来。它使用“零命中率”学习从描述和线索中生成输出。
我不得不查了一下什么是零射击学习,发现--如果计算机知道马是什么,但不是斑马,零射击学习就是计算机可以推断出斑马看起来像斑马的想法。所以它可以做出某种区分。这与我们如何通过演绎得出结论没有太大区别。。。正确的
问题所在
与深度假冒引发的反应类似,我看到一些人质疑整件事背后的道德规范。理解这种观点并不太难,因为任何类型的人工智能自我创造都会让我们感到有点不安--原因不同。我看到一些人的评论,他们对两个“事物”在一起是一个“事物”的不可思议的想法感到反感。这一切都与你使用的图片有关。
撇开道德问题不谈,作为一个有创意的人,我不禁认为这是我在未来几年失去工作和/或信誉的潜在方式,因为用Dall-E之类的工具取代照片编辑应用程序技能变得越来越容易。
所以你可能在想,你是认真的吗?这些图片看起来就像一场油炸的噩梦,只能存在于表情包中,而不是具有凝聚力、艺术性或(我敢说)专业的东西。这是因为我们使用的是该工具的免费、非高级版本。没错--有一个更强大的工具叫做Dall-E2,它对用户提出了更高的要求,规定了具体的内容限制和许可。(如果你想使用它,你必须加入等待名单。如果你想知道的话。。。是的,我在等待名单上。)
那么,更强大的Dall-E看起来是什么样子呢?好吧,抓紧你们的屁股。
更先进的DAL-E 2的输出。
这张图片直接来自他们的网站--该工具的案例研究。文字描述是“一名宇航员以照片写实的风格骑马。”
所以,正如你所看到的,这不仅仅是看起来“真实”的照片。你的图片有很多不同的外观。这种艺术自由是我最担心的,因为这个工具的功能如此先进,很难想象这个工具不能在任何地方找到应用程序。
对摄影和视频的影响
虽然Dall-E并不是对原创视频创作的具体威胁,但不难看出这会走向何方。已经有几个可用的视频生成工具;它们只是不能产生普通射手现在可以创造的东西。有很多人工智能生成的脚本和故事正开始渗透到世界上,但没有人在一个包中产生全部视频+音频生成。
也很容易想象这种威胁对创意人士来说是什么样子。如果一位客户正在做一个新的广告宣传活动,他们有一个明确的要求,想要一个沙漠山谷,背景是大悬崖,在黄金时段有一条蜿蜒的河流穿过,一辆车停在道路的左下角。。。嗯,他们可以支付这次拍摄的所有费用:模特、地点、摄影师、照相辅助、住宿和交通--清单还在继续。或者,他们也可以自己动手。不用离开办公室就能省下一大笔钱,然后把这个项目分配给实习生。
也许我只是疑神疑鬼;也许我只是对自己技能的未来缺乏安全感。然而,恐惧是真实存在的!
但也不全是坏事。我认为这些类型的工具有无数有趣的应用程序。例如,我有一个好朋友,他创建了一个Instagram账户,意在模仿现代的“胶片摄影师”。他对柯达股票、旧相机、陈词滥调的标语使用了所有相同的标签--唯一的问题是,这些图像都不是真的。它们都是100%由计算机生成的。甚至连他的头像都是电脑生成的。这是一个有趣的,我欣赏的喜剧--我喜欢人们对一个看似黑暗的情况进行轻描淡写。
@lincoln_bai yeaux是一个模仿电影摄影爱好者的Instagram个人资料。。。但一切都是电脑生成的。
不过,人工智能生成用户的想法并不新鲜。多年来,我们一直在与评论区和论坛中的机器人打交道,互联网用户对我们在网上看到的几乎所有东西都持怀疑态度,这变得越来越常见。我们的客户也知道这一点,所以它创造了一种奇怪的动态,大多数创意人员现在只是试图为自己的艺术声音达到一定程度的原创性和特殊性。也许这个新工具只是我们创作优秀艺术所需的灵感之火中的又一块铁。
你受到启发了吗?
我的亲身经历
每次我使用这款应用时,我的反应都不可能是奇怪的。通常,当我第一次看到他们时,我会笑。然后我发现自己只是默默地盯着他们,几乎被这种陌生感迷住了。这就像看着一只狗在院子里嗅来嗅去。你不知道为什么它如此令人震惊,但它确实是。
这里有一些我自己创作的作品,它们都是奇怪的、随机的。
好的,继续往前走。。。
出于显而易见的原因,这本书是我个人的最爱。好了,继续。
因此,在尝试了几个流行文化Mashup之后,我想我应该尝试一些类似于股票照片的东西,看看我们这里到底在处理什么。所以我输入了“日落山顶”,这就是它的结果。。。
我的第一个想法是,这并不可怕;它也不是很好--这只是我所期待的。话虽如此,它确实自己产生了这些图像,其中一些是令人信服的。
那么,现在我们已经基本了解了DALL-E是什么,它可以做什么,以及它是如何工作的,你认为这将是什么,这将彻底改变专业人士及其职业生涯的创作格局,只有时间才能证明这一点。