就在本周稍早,科技公司 Runway Research 公开了旗下即将推出的生产式 AI 模组「Gen-2」,这套最新的 AI 系统能透过用户输入的字串自动生成出一段短影片。
Runway Research 的 Gen-2 影片生产模组式透过一套由「2.4 亿张图片以及 640 万支短片组成的内部和客制化资料库」进行训练。简单来说,这套 AI 背後拥有着极为庞大的资料库,虽然目前依然无法确定官方提到的「客制化资料库」是不是透过蒐集网路上的大量作品整理而成的。因此,如果想要藉由生产出的影片获利的话,这个平台似乎并非最好的选择。
即使如此,Runway Research 全面升级後的 Gen-2 工具确实看起来比 Gen-1 的版本还要更加强大,而在这之前,已经有不少人利用 Gen-1 工具来协助绘制分镜图以及前制视觉特效,升级版式必能带来更加广泛的应用。虽然这项技术与 Meta 旗下的 AI 影片生产技术类似,但 Gen-2 模组似乎带来了一些更加有趣的模式。
不久之後,用户们只需要输入简单的文字,就能在这套工具上生成影片。不仅如此,Runway Research 团队还打算为这套影片工具加入一些其他的模式,像是一种能让这个平台将一支影片的画面转换成其他不同风格的演算法,而团队也在官方网站上详细揭露了这个全新版本工具的各种应用方式,其中一个最令人赞叹的范例,就是能够将一支展示几本放在桌子上的书本的影片转换成高楼林立的城市夜景,而桌上的那些书通通变成了高楼大厦。虽然成品的写实程度还有待加强,但这已经是个相当强大的视觉转换工具。
官方网站上公开的研究文件更进一步揭露了更多关於这些步骤的细节。这套工具从概念阶段至今经历了漫长的发展,就从这支预告短片来看,生产的影片成品在写实度的部分已经达到了一个新高峰,虽然目前距离能够生产出较长的影片似乎还有一段路要走。
目前的成果也让 Gen-2 成为了另一套值得关注的 AI 工具,随着这套工具在技术层面的推进,除了本身的完成度之外,对於整个产业将会造成什麽样的影响也值得注意。就如同 Runway Research 团队在官方网站上的说法,他们相信深度学习技术若应用在视听娱乐上,那势必将会永远改变艺术、创作和设计类的工具。
当用户在 Runway Research 网站上进行登记时,能够看到许多不同的方案选择,其中包含了免费以及付费的版本,但 Gen-2 的版本目前似乎还没有正式对外开放。根据 Runway Research 在官方 Discord 频道上揭露的资讯,他们可能会以付费公开 Beta 测试的形式推出 Gen-2,但目前已经吸引到了大量用户的关注。