

汽车在纽约上空飞行、中世纪居民头戴VR眼镜、宇航员在火星表面跳街舞、大卫雕塑爱打碟、古埃及的动物壁画玩电脑……欢迎来到AI绘图的世界!
输入文字就能得到你想要的任何画面,无论多么荒诞无理的要求,无论定制Edward Hopper画风还是宝丽来胶片,AI都能"使命必达"。
听上去如此梦幻的跨时代工具,似乎是下一波新技术浪潮的抬头,2022也被称为"AI绘图元年"。但是它就像任何一项新技术一样,难免伴随争议:究竟是开启了一个全新绘画时代,还是打开了潘多拉魔盒?无论你做何感想,AI绘图时代已经不可逆转地到来。
!ATTENTION!
以下图片纯属AI虚构
如有雷同,纯属巧合

● "一个人坐在办公室隔间里,用键盘打字,压力重重的样子 - 文艺复兴绘画风格"


● "金毛寻回犬小狗坐在小餐馆里喝咖啡,看起来很忧郁 - Edward Hopper风格"


● "战斗中戴着士兵头盔的猫猫特写 - 二战历史摄影风格,黑白"

● "一张非常细节、复古、颗粒感的纽约市汽车飞行照片(1936 年)"

● "宇航员b-boy组合在火星上表演 - 宝丽来风格"

● "用柯达专业Portra 400胶卷拍摄的外星人肖像 - 由Annie Leibovitz掌镜"

● "米开朗基罗的大卫雕塑正戴着耳机打碟"

● "在太空边缘奔跑,奔向星球,平静,抵达深渊 - 数字艺术风格"
以上这些画面都来自今年最热门的AI绘图平台DALL·E 2(ig:@openaidalle),AI制作它们的时间,可能不到一分钟。
不管是照片还是绘画,你想到什么,AI就能呈现什么。真有那么神奇吗?今天我们就先从DALL·E 2聊起。

创造奇迹的DALL·E 2
到底是何方神圣?

● DALL·E logo
作为AI绘图的大势平台,DALL-E 2的火爆常常让人忘记这个程序今年4月才刚刚推出。
初代DALL-E诞生于去年,在此基础上进行了升级的DALL-E 2图像分辨率更高,对指令的理解也更准确。


● 输入"日出时狐狸坐在田野上的画作,莫奈风格",左右分别为第一代和第二代AI交出的作业
"DALL-E"的名字来自《机器人总动员》中的机器人瓦力(WALL-E)和超现实主义画家达利(Dalí)。它也确实在功能上兼顾了两者:一个能制作超现实主义图像的机器人。


● 左:半人半机器版达利,右:瓦力版蒙娜丽莎,都由DALL·E 2绘制
在DALL-E 2宇宙里,脑洞有多大,世界就有多大。
你只需要给它一些描述语,包括画面内容、参考画风/画家、形式(摄影/绘画/雕塑)、工具(xx胶卷/镜头),剩下的就全部交给它。

● "古埃及壁画上的动物神明正在使用计算机"




● "数千个星系的超深场天文学照片"灵感来自韦伯望远镜拍下的图像,向左滑动
比如说,可以画成什么样?DALL·E 2官网给出了组词条:
A组词条描述行为:
"像狂热科学家一样混合化学物质"
"购买杂货"
"从事AI研究"
B组词条描述风格/状态:
"儿童蜡笔艺术"
"1980年代在月球上"
"和90年代科技产品一起待在水下"
"浮世绘风格"
……
把A组和B组连词成句,就能得到以下这些奇妙结果。









●
不过,DALL·E 2不仅会创造图像这么简单,还可以在现成图片上施展魔法。它能在照片里加入任何元素,并对阴影、反射和纹理进行细致处理,让新照片毫无违和感。
比如,我们要求DALL·E 2在美术馆照片上加一只柯基,并要求它分别出现在二次元画作上和三次元展馆里,AI就会自动计算柯基应该出现的样子。




● 在照片的123位置分别加入柯基会是什么效果?向左滑动看看
当然你也可以丢给DALL·E 2一张画作,让它以此为灵感去创作,《戴珍珠耳环的少女》从此便有了多个模样。









● DALL·E 2版《戴珍珠的少女》


● 给蒙娜丽莎换个莫西干头发型,或是狗狗换小猫,都不在话下
DALL·E 2究竟是如何工作的?
OpenAI曾对此做过视频解释。和大多数AI一样,DALL·E 2的根本原理是算法。通过深度学习大数据,从而掌握内在逻辑。运用在绘图领域的话,就是对海量的主题图片作归类总结。
比如成千上万的"考拉"图片构成一个网络,而"摩托车"图片则是毫不相干的另一个。当用户输入"考拉骑摩托车"时,AI就把这两个网络交叉组合,并从中选出符合要求的图片。



● 如果对DALL·E 2生成的结果不满意,用户可以进行修改,这些修改也在不断帮助DALL·E 2变得更准确

AI绘画正在占领赛博世界

● "机器人梦见电子羊"(cr:Sam Altman)
看到这里,如果你已经迫不及待要上手感受下DALL·E 2,那么很遗憾:DALL·E 2目前并未对大众开放。虽然可以申请加入waitlist,但大多情况下你只能拿着爱的号码牌,陷入无尽的等候。
远水解不了近渴。一款与DALL·E 2极为相似、且对公众开放的免费工具DALL-E mini引起了大家的兴趣。
它与DALL·E 2并无直接关系(现已改名Crayon),功能却基本一致。只要提交描述,它就能在极短时间内生成图片——虽然质感与DALL·E 2存在肉眼可见的差距,但是对于图个新鲜的网友们来说已经足够。

● "泳池派对的黑客"(cr:weirddalle)

● "当黑武士遇见pingu"(cr:weirddalle)

● "腹语人偶版扎克伯格"(cr:weirddalle)
对于更"资深"一点的玩家来说,AI绘画工具早已是任君挑选。除了DALL·E 2,如今受到关注的AI工具还包括:Disco Diffusion、Midjourney、NightCafe、wombo、CogView等等。
这些工具使用起来难易程度不一,比如CogView是国内团队开发的AI工具,仅支持中文搜索。而Disco Diffusion充满代码的界面略为赶客,需要跟着教程一步步操作。


● Disco Diffusion与CogView界面
我们也玩了一把!
在AI绘图app"dream by wombo"(可免费下载)上,我们试着以"voicer"为关键词,分别生成了"吉卜力""蒸汽朋克""浮世绘""达利"风格的图片。




● 你最中意哪个?
当然最终效果也大多与AI工具的操作难易程度成正比。CogView生成的图片多少带点AI痕迹,而Disco Diffusion的玩家社区,早已成为浪漫想象力与美术功底的竞技场。
这些原本就是高超画手的用户们,与Disco Diffusion不断磨合调教,创作出无数难以辨别AI绘画痕迹的优秀作品。

● "Father Time"(cr:@noah__proctor)



● 比起DALL·E 2,Disco Diffusion似乎更擅长描绘恢弘的场景(cr:@discodiffusion)

● Disco Diffusion社区用户总结了在同一描述下,各个画家的关键词会生成的不同风格,截图为其中一部分
虽然2022被成为"AI绘画元年",但"AI绘画"绝非一个全新概念。
只是在这项技术发展早期,人们对此态度并不乐观。而当时算法也还没有那么强大,AI的作品停留在学龄前儿童水平。

● 即便是现在,DALL·E 2还是会生成两个手掌长在一起这样视觉错乱的图片
不过人们对于AI作画的探索并未就此停止,反而奋勇向前。在互联网流行AI作画之前,实体AI作画就已经受到不小的关注。
根据《好奇心日报》2018年的报道,当年国际机器人艺术大赛的获奖名单里有不少对AI作画的实验。
加拿大艺术家Joanne Hastie制作了由编程控制绘画的机械臂;美国艺术家Pindar Van Arman创造的AI机器人,可以模仿所给图片绘画;泰国机器人实验室CMIT Robotics则可以捕捉人类在绘画时的每一个动作轨迹,机器人通过精准复制动作,从而完整复刻人类的画作。


● Joanne Hastie创造的及其抽象作品


● 只要人类先画一遍,CMIT Robotics就能近乎完美地复刻

● Van Arman的AI机器人可以根据动态热力图来调整作画
而在四年后的今天,AI机器人作画显然又向前迈进一大步。在今年威尼斯双年展上亮相的AI艺术家"Ai-Da",是一个拥有机械臂、外形酷似人类的机器人。
和街头画家一样,Ai-Da用机械臂绘制人物肖像,并且配置了和人类对话的智能程序及发声器,可以边作画边与绘画对象攀谈。

● Ai-Da和她的自画像



● Ai-Da的肖像作品

● 世界上第一幅由AI机器人绘制的英国女王肖像

天才画手还是恐怖黑箱?

● "人们戴着VR眼镜的中世纪画作",由DALL·E 2生成
当AI绘画的实力越来越强劲,问题也随之而来:它会替代传统绘画吗?画手们是否会面临集体失业?
有人对此保持乐观。毕竟虽然AI很强大,但本质上还是依赖人类的原创。它没有独立创造某种风格的能力,而Edward Hopper有。



● 无论美漫风格、数字艺术风格还是宝丽来,DALL·E 2都是参照人类创造出的现有风格
也有人对此非常悲观。虽然高端画师暂时还不会被取代,但是普通画手的创作却可能变得越来越不值钱。
此外,AI绘图还面临着更多问题。
一个月前,DALL·E 2发布了一张AI图片,描述语为"一个男人举起双臂和双手,用手势表示‘这么多’"。

● DALL·E 2生成结果
这张生成图片里的男子,有点像每年苹果发布会上的乔布斯,立刻引发了网友不满:为什么"一个男人"="年轻的白人男性"?难道AI世界也奉行白人中心主义吗?
但是考虑到DALL·E 2的运行逻辑,它也许只是这个充满偏见的世界的缩影。
它的学习素材都来自人类的图片——如果人类的图片世界本身就充满偏见和刻板印象,又怎么期待AI能根据"A man"的描述语生成黄种人或黑人?或者根据"护士"的描述语,生成男女比例对等的图片?

● DALL·E 2生成的"建筑工人"图片

● DALL·E 2生成的"空乘人员"图片
更严重的问题可能来自法律纠纷。
AI绘图是否会重蹈AI换脸技术的覆辙,被用来做一些侵犯他人权利的事情?如果AI能够随意生成他人的照片,那么狗仔们是否从此有了造谣利器,而政客们也有了陷害对手的把柄?

● 右下角的OpenAi logo提示你这张"白宫失火"图片是假的,但如果有人别有用心地裁掉logo呢?
你可能想将它用于正当的事情,但实际上你也可能将它用于各种疯狂的、要求严苛的应用场景,其中包括(欺骗性的照片和视频等)深度伪造。
- Subbarao Kambhampati
(亚利桑那州立大学计算机技术教授)
图片版权是一个更难厘清的问题。关于AI生成图片能否商用,各平台众口纷纭。通过学习他人画作生成的作品,是否会侵犯到原作者权益?这给知识产权领域提出了新的思考。
如果AI绘图有一天完全成为大众工具,那么现实与虚拟的边界无疑将被进一步模糊。



● 网友Aditya Ramesh使用DALL·E 2将维多利亚式房屋改造成现代房屋,把特斯拉变成老爷车,把iPhone变成老式电话
200年前摄影技术诞生时,给绘画带来的最大冲击即是"真实感"——我们可以不相信绘画,却不能不相信一张真实的照片。然而200年后蓄势待发的AI绘图技术反其道而行之,进一步消解了图像的真实性。
等到AI绘图真的占领互联网的那一天,我们还能相信眼睛看到的任何一张图片吗?

就像摄影最终没有取代绘画一样
AI绘图引起的恐慌也未必会成真
但正是在一次次对新技术的反思中
我们才不断确立了人类所处的位置
和我们究竟想要怎样的世界
你有试过AI绘图吗?
对这项技术你是向往还是担忧?
欢迎在评论区分享看法!
原文地址:http://www.myzaker.com/article/62f9b3b58e9f0935eb653624