在这篇文章的开头,世超先来给大家看一张图片。
还有这张。
以及这张。
当然,给大家看这几张风景照是有原因的,因为这些图片完全由 AI 技术生成,是假的。。。
其实世超已经对各种 AI 技术快要听腻了,但是这个自动生成图片的技术确实能让人眼前一亮。
这些图片不仅看上去跟真的照片一样,而且是根据你的想法进行创作的。
只要你在上面随便画两笔,而就是这再简单不过的几笔,AI 就可以在你极其简单的创作基础上添加 “ 亿点点 ” 细节。。。
简直离天下之大谱。。。
而这个黑科技一般的玩意儿,出自我们熟悉的英伟达之手,这是一个叫做PoE GAN的 AI 技术。
这里的 PoE 指的是 Product of Experts,专家乘积,而 GAN 就是生成对抗网络的意思。
是不是听不懂?没关系我也听不懂。。。
但大家不需要知道具体的意思,只要知道 PoE GAN 是一种究极缝合怪,它既能识别出你的灵魂绘画,也能根据文字输入生成画面。
只要在上面随便画两笔,它就会立刻响应并生成对应的画面。
你加多少,它就生成多少,分毫不差。
无论怎么群魔乱舞,AI 都能从容不迫地应对过来。
你也不用去管里面的细节,AI 会自动识别不同的区域,比如波浪形状的就是山峰,图片顶部就是天空等等。
要是你不喜欢现在的样子,还可以改变地形和天气,想要啥样的都能给你整出来。
你还可以直接敲字,AI 就会实时分析出来再把文字转化成图像。
比如打出山峰被雪覆盖,画面就会从山峰变成覆盖了积雪的山。
或者打出沙滩,画面会立刻出现对应的景象。
但是你后面接着打出多云,天空就会跟着发生变化。
世超第一次看确实觉得很惊喜,但是看多了这种演示,难免也会对这项技术产生一些疑问。
比如,PoE GAN 是不是只是单纯地把已经学习到的素材进行拼接,才产生出了这些图片?
还真不是这样,PoE GAN 不止会把大片的树木、山脉、天空和海洋拼接在一起,还会按照你画出来的细节进行填充。
比如演示中画出来的一小块谜之物体就会被 AI 识别出来,并生成了海洋中的一块石头。
不仅识别成功,画面中的细节也遵循了现实生活的逻辑,比如石头周围就会有海浪产生,海水也是白色的。
这个细节,有点东西。
不过为了能够对这玩意儿了解更深一点,世超还是去网上查到了英伟达官方的资料和说明,想看看具体的解释。
目前现有的图像合成框架里,遇到单一类型的需求是没问题的,但要是各种不同的需求一起上,那 AI 就当场懵逼了。。。
而 PoE GAN 的诞生就是为了解决这一限制,它可以识别不同的输入,并把它们混合在一起。
比如这里有一个非常直观的例子,当你只选择简笔画的时候,画面会按照目前的需求生成一幅图像。
这时我再加上不同的颜色和文字,把不同的区域分隔开来,画面就会按照需求变成另外一副模样。
而当把详细的文字描述也勾选上,此时图像就会在按照要求已经生成的图像基础上,进一步满足人们苛刻的要求。
PoE GAN 确实很神奇,但这项技术也不是最近才出现的,英伟达在 2019 年就搞出来了一个 AI 技术,叫做GauGAN。
名字听上去有点怪,但这项技术确实能够让人们以低到不能再低的门槛,来让 AI 生成一幅以假乱真的图片。
后来 GauGAN 进化出了 GauGAN2,同时它带来了一个新的玩法,那就是打字画画。
只要你在文本框上面疯狂敲键盘, AI 就会根据文字自动生成对应的画面。
再往后就是前面提到的缝合怪 PoE GAN 了,这玩意儿进化的速度还真够快的。。。
总的来讲,英伟达的这个新技术确实非常黑科技,随便打打字就能生成一张以假乱真的图片,这要是放在几年前,估计所有人都觉得是在扯淡。
结果在开发人员一通捣鼓之后,还真把这种看着像魔法一样的画面给变成现实了。
以前需要找一张风景照片,要么去版权网站上面找一张,要么自己出门拍一张。
而现在只要让 AI 生成一下就可以了,就算在炎热的夏天也可以轻松搞到一幅雪天美景。
而这个过程,基本不会花费任何力气。
世超估计看到这个技术的绘画、游戏和相关从业人员都高兴得够呛,终于不用再累死累活设计背景了。。。
但是评论区也有摄影师表示担忧,以后人们不用再出门就可以制作出美景了。
无论如何,这项技术确实让不少人大开眼界,也让世超更加期待未来的创作过程会产生怎样的革新了。
撰文:百威编辑:面线
图片、资料来源:
YouTube - Two Minute Papers
NVIDIA Corporation - Multimodal Conditional Image Synthesis with Product-of-Experts GANs
cnBeta - 英伟达最新 AI 技术可将文字转化为逼真的图像
关键词: 编段话就能变出一张图片 英伟达不卖显卡改卖艺了