写几笔脑洞,就能生成视效大片。这在以前只存于幻想,可如今却成了现实。

当地时间2月15日,美国人工智能研究公司OpenAI发布了文生视频模型Sora,瞬间引爆全球网络。这也是其司继曾ChatGPT之后,再度将AI技术推至舆论高点。

据官方介绍,用户只要输入提示词、文字指令或者静态图像,即可获得一条长达60S的内容视频,并且从案例来看,视频的场景精细度高、镜头机位丰富,角色生动有情绪,品质极高。

当拍摄《流浪地球10》,只需要敲几行字-风君小屋帮我吧
图源:OpenAI页面

当然,其中难免有一些bug,但是不影响主流声音。很多专家学者认为,Sora的出现,拓展了AI视频技术的极限,将为社会生产和生活带来巨大改变,但是相应的,由于技术的替代性,也会抢夺部分人员的“饭碗”,尤其是传媒、影视、游戏等内容创作领域。

《年会不能停!》的编剧、导演董润年就直接在微博表示:传统影视行业基本要结束了,大家想想转行以后做点什么。

当拍摄《流浪地球10》,只需要敲几行字-风君小屋帮我吧

理论上讲,如果Sora的技术达到成熟,以及规避风险开放公用,那么确实每一个人均能先用ChatGPT写剧本,再用Sora生成影像。届时,人人皆可是导演,人人亦不是导演。

这无疑会让部分工种消失,不过于行业发展的大方向而言,却也有相当利好的一面。因为假使硬件制作端趋于同质化,只会让创作的本质——创意显得更加重要,同时行业会整体更为注重版权保护,AI信息的输入与输出会非常谨慎。

以及,更关键的是,AI技术哪怕再强大,也不会凌驾于人的创作之上。艺术是生命的最高使命和生命本来的形而上活动。技术和艺术的属性即决定,AI永远只能是工具,不能取代生命力本身的勃发与光彩。

而亦正因如此,怎样认识与学会使用AI就变得很重要。就像学会使用汽车、电脑、互联网等产品,令之服务于生活。毕竟,生产工具决定生产力,生产力推动社会发展。

“导演”Sora

Sora可音译为索拉,在日语里有“天空”的意思,也可引申为“自由”。顾名思义,产品目的即是让创意灵感自由翱翔。正如在其官方介绍页里,能看到很多纸飞机在空中肆意飞扬。

其实在Sora之前,市面上已经有了Runway、Pika Labs和Stable Video等AI生成视频模型,但是均未引起如此大的关注与讨论。归根结底,是Sora的拟真度实在太高。

截止发稿前,OpenAI已更新了48个案例视频,内容包罗万象,比如可爱小狗在雪地玩耍、时尚女性行走在东京街头、人群追随舞龙队伍等现实场景;再比如灭绝的猛犸象踏雪而来、鲨鱼游在高楼大厦之间等偏奇幻场景;还有模拟的高品质3D动画片,里面的动物毛发清晰可见。

当拍摄《流浪地球10》,只需要敲几行字-风君小屋帮我吧
图源:OpenAI页面

这些视频充分显示,Sora在时长规格、运镜构图、生物拟态等维度均有极大突破,甚至大多细节已和人工拍摄不相上下,很像一位真实的“导演”。

时长方面,此前AI 生成的视频都在 4 到 16 秒之间,并且有些卡顿,类似PPT。而Sora则将这一数据提升了4到15倍,同时能保持流畅性。规格方面,其从宽屏的1920x1080p到竖屏的1080x1920均能适应,可以打造出匹配画幅的高精度内容。

当拍摄《流浪地球10》,只需要敲几行字-风君小屋帮我吧
图源:OpenAI页面

另外,Sora还有视频时间线延展功能,用户提供一段视频,Sora能为其填补前面或者后面的视频内容。

运镜上,Sora有自己的“镜头语言”。区别于通常单一视角的AI视频输出,针对同样的场景和人物关系动作,Sora可以像拍电影一样,变换镜头角度和景别位置,完成广角、中景、近景、特写等不同视角的画面,以及自动形成剪辑。

当拍摄《流浪地球10》,只需要敲几行字-风君小屋帮我吧
图源:OpenAI页面

Sora也能融合场景,类似用「一支笔掉落在桌上+零食袋掉落在地上」生成「零食袋掉落在桌上」。

生物拟态侧,情绪是人或者动物特有的生命状态,在喜怒哀乐的表达上,Sora明显更为灵动自然。

当拍摄《流浪地球10》,只需要敲几行字-风君小屋帮我吧
图源:OpenAI页面

而得出以上效果,与Sora对于“世界模型”的探索息息相关。

“世界模型”是AI技术的终极目标,也就是理解、重建和模拟物理世界。原理大体为,让AI像人类一样先认识和了解这个世界,再做出反应,输出内容。由此,Sora的视频更顺畅且符合现实逻辑,可以跳出2D图片的限制,模拟出接近真实世界的场景和体验。

其中,OpenAI特别在AI训练时,给所用的视频素材匹配了高质量的文本描述,以求整体提高输出视频的质量。

鉴于AI的训练水平和“世界模型”的构建还不完善。Sora也有不少穿帮画面,多为物理问题。例如老奶奶吹蜡烛,蜡烛没有熄灭;装着水的玻璃杯没有碎,可是水已经流出;三只小狗一起玩,凭空出现了更多小狗;篮球撞破篮筐,发生了爆炸等。

当拍摄《流浪地球10》,只需要敲几行字-风君小屋帮我吧
Sora穿帮画面:男子倒行跑步机

简单说,作为“导演”,Sora还需要更多熟悉真实世界。

“鲶鱼”Sora

Sora的出现,引得众多KOL纷纷发表评论,有人担心引发行业危机,也有人持赞赏的态度。360集团创始人、董事长周鸿祎就表示,随着Sora的到来,人类离AGI真的不远了,不是十年、二十年的问题,可能一两年就可以实现。

而无可避免的,Sora亦带来了长时间伴随AI的伦理问题。前段时间,梅西的道歉视频就曾被质疑为AI所制,在网上引起了讨论。假设Sora投入运用,同样的话题将会大大增多。

以后的事还需时间验证,不过至少在短期看,Sora会像一条鲶鱼,搅动行业生产活水。

当拍摄《流浪地球10》,只需要敲几行字-风君小屋帮我吧
图源:OpenAI页面

实际上,不管是游戏行业,还是影视行业,抑或是工厂运营、自动驾驶等实体产业,相关公司从未停止对AI的探索。某种意义上,作为工业化和科技化的标志,AI是降本增效的关键。

影视行业,Netflix在2021年10月上线了一部AI创作的悬疑喜剧动画《谜题先生希望你少活一点》;好莱坞公会在去年3月宣布,在不影响编剧署名和分成的前提下,允许AI运用于剧本创作,国内如华策、光线等公司也公开发出了鼓励的声音;阿里大文娱则在近期优酷播出的剧集《大唐狄公案》中,以AI辅助生成了人流、街景、楼宇建筑等画面。

当拍摄《流浪地球10》,只需要敲几行字-风君小屋帮我吧
《大唐狄公案》AI辅助场景

游戏行业,基于对游戏体验和制作成本的刚性诉求,各大游戏公司一直致力于自研AI系统,涉及语音、原画、动捕等诸多环节,《王者荣耀》就有游戏试练AI“绝悟”。短视频行业,字节跳动则在去年11月发布过文生视频PixelDance,功能与Sora有部分类似,但是至今未开放用户测试。

这样看,在Sora的刺激下,本来就在AI赛道上发力的公司会加大马力,升级技术,保持战略优势和竞争力。

值得一提的是,Sora的核心成员仅有13人,而且平均年龄不高,2位负责人刚刚博士毕业,这也给国内培养AI人才给予了启示。

当拍摄《流浪地球10》,只需要敲几行字-风君小屋帮我吧
图源:OpenAI页面

技术之外,创意亦然,甚至更加珍贵。从Sora的流程属性看,有了AI辅助,制作和技术侧的局限会大幅降低,一个作品的品质将无限依赖于创作者的审美水平和指令逻辑。

与此同时,创作者使用现有艺术元素或者内容的门槛会极大提高,IP版权的成本将取代制作环节的成本。

这种情况下,道具师、剪辑师、特效师等制作端岗位可能处境严峻,创作者的内容也会愈发五花八门,需要法律和监管部门严格管控。

Sora发布不到12小时,导演郭帆在朋友圈转发了相关链接并感叹“太快了……”。尽管现在还不能“一键”生成《流浪地球3》,但是《流浪地球10》,并非没可能。

当拍摄《流浪地球10》,只需要敲几行字-风君小屋帮我吧