栏目导航
联系我们

电影预告一键生成Midjourney+Gen-2生成视频刷屏了

发表时间: 2023-12-31 作者: 贝博平台网页登录

  这几天,很多人的朋友圈都被 刷了屏。这些写真来自一个名叫「妙鸭相机」的微信小程序,主打一个低门槛、人人可用,而且效果媲美花大几百在照相馆拍的写真,因此俘获了大批网友。

  「妙鸭相机」的走红是生成式 AI 技术逐渐破圈的标志性事件,它用一个非常明确的应用场景向大众展示了这些技术的具体能力。与此同时,国内外其他公司也纷纷发力,把手里的技术封装成一个个人人可用的 AIGC 产品,Runway 前几个月发布的 Gen-1、Gen-2 便是其中之一。

  和很多文生图类应用不同,Runway 的 Gen-1、Gen-2 挑战的是一项更有难度的事情 —— 视频编辑和生成。其中,Gen-2 不但可以像 Gen-1 一样在原视频的基础上编辑出符合用户想要的视频,还可以从头生成视频。但遗憾的是,在最初发布时,Gen-2 只能在有限的候补名单中使用。

  不过,这一限制在今天被彻底打破。刚刚,Runway 宣布,Gen-1 和 Gen-2 已经彻底开放,任何人都能注册一个账号免费尝试。生成的视频长度为 4 秒,每秒消耗 5 个积分,利用免费额度可以生成二十几个视频。如果免费积分耗尽,付费标准为 0.01 美元 / 积分,也就是生成一个视频需要 0.2 美元。

  这一限制的解除让已经发布数月的 Gen-2 再度走红,慢慢的变多的人晒出了自己的试用结果。在欣赏网友的大作之前,我们先看看这个应用能做什么。

  今年 2 月份,Runway 发布了 Gen-1。它的功能很丰富,包括风格化、故事版、蒙版、渲染、自定义等等。

  故事版是一个电影学名词,指在影片的实际拍摄或绘制之前,将剧本的文字描述转换成一格一格叙述故事进展的图画。Gen-1 可以将一个类似故事版的视频转换为具有特定场景的视频。

  蒙版(mask)能够理解为修改视频中的指定部分,而别的部分保持不变。比如,给定以下原始视频:

  然后向 Gen-1 输入文字指令「白毛上有黑点的狗。」我们就能够获得编辑后的视频。

  渲染是指将计算机生成的 3D 场景或特效图像转换成最终影像。比如,给定以下原始视频:

  今年 3 月份发布的 Gen-2 延续了这些功能,可以将图片或文本提示的构图和风格应用于原视频上。同时,它还新增了文字、图片生成视频功能。也就是说,仅需输入文字、图像或文字加图像的描述,Gen-2 即可在很短的时间内生成相关视频。它是市场上第一个公开可用的文本到视频模型。

  比如,我们输入一段纯文字:「午后的阳光透过纽约阁楼的窗户照进来。」Gen-2 会直接「脑补」出视频:

  输入一张照片 + 文字「低角度镜头:一个男人走在街上,被他周围酒吧的霓虹灯照亮。」

  目前,Runway 已经开放了网页端的免费体验窗口,相关应用(RunwayML)也已经在苹果的应用商店上线。

  Gen-2 限制的解除让这款应用在社会化媒体再次刷屏,网友纷纷晒出了自己的试用效果:

  还有不少人尝试将此前大火的文生图模型 Midjourney 与 Gen-2 结合在一起使用,生成效果很惊艳:

  有人已经用这些工具做出了一部虚构电影的预告片(利用 Midjourney 生成的图):