另一种功能。
AI 作画又有了新的风向。
最近,来自慕尼黑大学的研究者与多方机构合作,共同推出了一款名为 "Stable Diffusion" 的文本转图像模型,能够在消费级 CPU 上运行,且图片无需任何预处理。目前该模型代码已经开源,任何人都可自行下载并运行这个程序。
一幅由 Stable Diffusion 自动生成的图片
只需等待数秒钟,程序便可根据给出的文本自动生成图片,且允许免费商用。由于开源、生成时间短、图片精美等原因,让 Stable Diffusion 连同 AI 作画再次成为了网友们热议的话题。
而除了使用最广也最流行的 " 文本作画 " 功能外,不少人也开始在这个程序中开发更多的新玩法。
比如一位 ID 为 "frigis9" 的用户就在国外论坛上发布了一则关于 " 像素高清化 " 的帖子,介绍了他是如何通过 AI 技术将过去经典的像素游戏画面转变为高清图画的。
他选用的素材是曾在 MS-DOS 平台上非常经典的《基恩指挥官 6》与《猴岛小英雄》,通过 AI 的处理后,可以看到原本较为粗糙且清晰度不高的游戏画面被渲染成了高清且更加真实的图片。
实现这样的效果,依靠的是模型中一种名为 "img2img"(图像到图像)的功能,和常见的 AI 作画不同,除了文本以外,它还允许用户提前给定一幅图片,系统最终会根据用户文本,在已有图片的基础上生成新的画面。
除了前面提到的两款经典 DOS 游戏外,frigis9 还发布了通过 AI 升级后的多幅像素图画,比如来自《星球大战:黑暗原力》的角色凯尔 · 卡塔恩,原有的像素画面在经过 AI 处理后,变成了更接近真人的图片:
不过虽然看上去非常智能,但为了能够让 AI 准确地还原画面,这项技术目前依旧需要人工的干预。frigis9 就在帖子中坦白为了得到观感更好的图片,他需要在软件中调整多方面参数,并且不断更换关键词的描述,前后经过了近百次的微调,才最终得出了理想的还原图。
就拿《基恩指挥官》的像素图片来说,如果你只是简单在文本框中输入 "a helmet holding a laser gun"(带头盔的人拿着一把激光枪)而没有做更多微调和细节描述,那么最终生成的图片很可能让人哭笑不得:
原文地址:http://www.myzaker.com/article/63161c73b15ec02e6c591598