机器猫要来了?“世界模拟器”Sora到底牛在哪丨大象深度

猛犸视频 2024-02-20 21:21:57

大象新闻记者 李昌/文 姜明圆/视频

马斯克感叹“人类愿赌服输”,360集团创始人、董事长兼CEO周鸿祎预言“AGI实现将从10年缩短到1年”……这两天,美国人工智能研究公司OpenAI发布的首款文生视频大模型Sora,迅速以黑马之姿占据科技领域话题中心,让诸多科技大佬纷纷下场评论,认为这项科技将“改变人类、引领时代”。

Sora到底是啥?它将会如何改变人类?它的到来又将会颠覆哪些行业?对此,AI从业者、互联网科技企业创始人告诉大象新闻记者:Sora的诞生,让机器猫这种过去只存在在漫画里的智能卡通形象,离人类越来越近!

什么是Sora?

曾经在中国传媒大学导演系读研的时候,媒体人小泽就有过一个“幻想”:未来的电影,不再需要天价合同的演员,也不需要制片人撬动大量资金,仅靠AI技术,就能将一个好故事搬上大银幕,实现影视自由!

小泽原以为,这个想法起码要二十年才能实现,然而今年春节期间, OpenAI发布的“文生视频”工具Sora,让他激动地直拍大腿——曾经的“幻想”,也许近两年就能成为现实!

所谓“文生视频”,顾名思义,就是能够根据用户输入简单的文字指令,快速生成一段高度相关AI视频(人工智能视频)。

文生视频并非Sora首创,但为何Sora的发布却震惊了全球呢?因为在刚刚过去的2023年,大部分文字生成的AI视频长度都在4-6秒,即便是全球最火的两家AI公司Runway和Pika,也只是将2024年的核心目标定为能够生成15秒的AI视频。而Sora的横空出世,直接能让用户快速生成一段长达1分钟的高清AI视频,且视频中的主角和背景,都惊人的逼真!

与此前的AI视频存在明显的漏洞和塑料感不同,此次Sora制作的视频在逼真度和艺术感方面有着显著差别:视频主角的头发随风而动,就连脸上的黑痣粉刺都纤毫毕现;视频背景中,地面积水倒映的霓虹光影,天空同时飘落了出现在不同季节的樱花和细雪,竟也毫无违和感……视频细节的精细度让不少网友疑惑:这竟然是AI视频?

更令人惊讶的是,Sora视频在构图、色彩和运镜方面,都呈现出明显的电影感,这是此前的文生视频产品所不具备的。让看过Sora视频和其他AI视频对比的网友直呼:OpenAI一出手就将整个AI视频行业提升了一个级别!

Sora有多牛?

在普通人眼里,Sora只是一个能以假乱真的AI视频生成工具,但在科技行业从业者眼中,Sora的横空出世,是人工智能行业前进的一大步。上海千随网络科技有限公司联合创始人孙杨认为,AGI(通用人工智能)离人类不再遥远。

“Sora之所以能将生成视频从数秒钟,进化到一分钟,原因在于解题思路与传统完全不同。”孙杨表示,对比Runway、Pika等同类模型,Sora的特别之处在于,它能够理解和模拟真实世界,从而生成符合物理和运动学规律的复杂场景的超逼真视频。例如,当Sora学习人吃汉堡的视频时,它记住的不仅是吃汉堡这一“具体画面”,还有“咬了就会有痕迹”这个“物理规律”,从而让AI生成的视频更真实。

“长期来讲,这个模型再往后发展的话,就是如果真的能像他说的,是对世界的一个还原,真的能理解一些基础的物理、生物、化学,甚至包括因果上的一些联系、规律,那实际上它就相当于能够理解我们所在的这个现实世界了,这是人工智能的一个最终方向。”

“Sora的出现预示着可能AGI会提前到来。到时候各行各业都会被颠覆掉,也就是说,人类能做的事情,AGI全都可以做。”孙杨表示:“机器猫这种过去只存在在漫画里的智能卡通形象,现在来看好像是近在眼前了。”

不过,孙杨也认为,Sora真的要达到“世界模拟器”的状态,还要通过大量的训练,算法的精进,或者是模型的迭代。

“我们要训练这个AI去了解认识世界的时候,实际上是需要提供大量的视频的。”孙杨说,比如撕纸这个简单的动作,撕到一半停下来,让模型来预测后面会发生什么——正常人都知道纸要被撕开了嘛,但这个模型训练了200个小时,也就是看了200个小时视频之后,他才稳定的记住了这件事情。“人类现有的这些视频,可能都不足以去完成这个训练量。现在Sora就可以先生成一批视频,然后再去训练模型,最终形成一个闭环。”

Sora未来会砸掉谁的饭碗?

虽然AI视频刚刚诞生,却已经左右了好莱坞劳资谈判:在不久前美国好莱坞演员和编剧工会大罢工期间的谈判过程中,当演员编剧们得知迪士尼漫威新一季的《秘密入侵》已经完全使用AI技术打造开场场景后,直接导致双方的谈判搁浅。

对此,前高校新闻与传媒学院主任、自媒体创业者曾光认为,如今,Sora有望凭借“一己之力”,拿下导演、摄影、剪辑等工作,制片人为何还要花费精力和金钱,去张罗这些相关行业从业者?“因此,Sora的发展,会对传统的影视相关行业造成颠覆性的冲击,给从业者失业带来‘结构性失业’,即不能适应创新的人将会面临失业”。

的确,行业调查公司CVL Economics上个月发布的一项对300位好莱坞行业领袖的调查显示,75%的受访者承认,生成式AI已经促使他们业务部门削减及工作岗位合并。这些掌控着好莱坞行业秩序的人们预计,未来三年,好莱坞总计会有超过20万人的工作岗位遭受AI冲击,尤其是视觉特效、音效师、画图师等后期工作岗位。

曾光判断,国内正处于短视频时代,Sora的诞生,或将首先导致制造短视频的相关从业者面临下岗危险。

对此,国内微短剧头部制作公司,风华正茂影业创始人汪维伟告诉大象新闻记者,他们对此持审慎乐观的态度。

“技术的革新它不应该只是给我们带来危机,而是能帮助我们更好的去发挥想象力,把此前无法实现的想象变成现实。”汪维伟认为,创新事物对行业冲击颠覆的同时,也会带来大量新就业机会,关键是看自己能否通过自我提升,与新事物共生共成长,“我觉得从业者、创作者,需要主动去拥抱AI技术,掌握跟它对话的能力,这个才是重点。”

责任编辑:张家赫

0 阅读:5