春节后复工,AI领域又有大事?龙年大年初七,OpenAI在官网正式发布了文生视频大模型Sora,引起行业关注。

不仅如此,一向保守的央视新闻也对非本土的Open AI推出的文生视频大模型十分关注,不仅报道了它,还将其誉为“首个大型视频生成模型”,可见Sora在国内引起了强烈反响。

视频生成模型Sora为何引起业界关注?Sora模型将拉大算力缺口!

为什么同样作为一款通过输入文本生成视频的人工智能大模型,Sora可以突破此前行业内的同类型产品,获得如此大的关注?先不谈Open AI作为AI大模型研发领军者在业内本来就具有很高的关注度,更重要的是这款文生视频大模型相比之前模型的颠覆之处,令围观者叹为观止。

真实物理世界的模拟器

有机构认为,Open AI的Sora效果远超此前的同类型模型的根本原因在于模拟世界物理的能力。如Open AI发布的Sora技术报告所示,Sora生成的视频是基于对真实物理世界的理解,不同于此前大部分的AI生成视频采用的基于“大模型+大数据”架构,Sora大模型生成的视频内容更加符合真实物理世界的逻辑。

例如在雨后的东京街头,潮湿地面反射霓虹灯光影效果堪比电影效果。

视频生成模型Sora为何引起业界关注?Sora模型将拉大算力缺口!

Sora发布后的几天内,微博热榜就出现了“现实不存在了!”的评论,似乎Sora近乎逼真的视频让网友们分不清哪个是真实的物理世界。

视频生成模型Sora为何引起业界关注?Sora模型将拉大算力缺口!

生成视频时长长达60s

要知道,在Sora模型公布之前,行业内文生视频模型可生成的单个连贯性视频最大时长为16秒,行业内平均水平为2-4秒。而此次Sora支持的最大视频时长是60秒,直接创造了文生视频模型的新里程碑。

通过输入文字即可生成60秒的视频,这意味着创作者通过输入60个剧本,即可创造出一部1小时的剧情,这对于影视行业的影响是非常深刻的。

多角度镜头展示人物

与此前单镜头的AI生成视频不同的是,由Sora所生成的视频能够在保持人物主体一致性的前提下实现多角度镜头无缝切换,使整个画面流畅干净,从而实现真正的“高级运镜大片”效果。

例如雨后一位身着红色长裙的女士漫步在东京街头,Sora根据提示词生成的视频,对场景中人物的刻画由远及近,多镜头展示文字描述的人物。

视频生成模型Sora为何引起业界关注?Sora模型将拉大算力缺口!

当然新鲜出炉的Sora也有不足的地方,比如颠倒了玻璃破碎和液体溢出顺序。

视频生成模型Sora为何引起业界关注?Sora模型将拉大算力缺口!

再比如人背对跑步机,朝着相反的方向奔跑。

视频生成模型Sora为何引起业界关注?Sora模型将拉大算力缺口!

尽管Sora闹出了一些令人啼笑皆非的情况,它的发布还是引起了人们对于AI诈骗变得更加难以识别的担忧。要知道在Sora模型发布前,中国就发生过多起涉及大笔金额的AI换脸诈骗,骗子利用AI换脸与声音模仿技术修改公开视频和其他镜头,以骗取人们的钱财。试想一下,如果诈骗分子利用Sora生成一个熟人出现意外事故和正在紧急抢救的视频,再通过Ai换脸技术和您视频通话,哭诉寻求手术费,一系列操作下来很难不上当。

值得一提的是,Sora的发布也给国产算力带来了好消息。由于视频训练所需的数据量远大于文本训练的数据量,预计Sora的发布会促进国内文生视频模型的研发,从而进一步拉大对算力的需求。在美国算力和高级AI芯片出口管制的情况下,国产算力有望加速发展,以力求满足国内同类型模型运行需求。

然而自Chat GPT推出以来,国产算力在满足AI行业发展方面一直存在很大缺口,AI大模型的发展或将受到严重制约。越来越多的公司提供算力租赁业务来填补算力缺口。据不完全统计,在2023年期间,增加算力租赁业务的A股上市企业不下于80家,其中既有传统的IDC,还有如算力云平台等云服务商,也不乏如主营调味品的莲花健康等跨界公司。算力行业的繁荣发展,将成为AI大模型未来的坚实基础。近日算力云平台还有推出全场显卡价格下降75%的活动,对于需要大量高性能显卡进行AI大模型推理、训练、运行的企业来说是一次不容错过的机会,算力云平台是一家专业有保障的AI算力租赁平台,价格地道,有专业技术人员随时答疑解惑。

视频生成模型Sora为何引起业界关注?Sora模型将拉大算力缺口!

在人工智能技术不断趋于成熟的趋势下,我们有理由相信AI大模型会呈现百花齐放的现象。凡事皆有利弊,随着AI技术刷新人类的认知,越来越多普通人能够获得成就自己的机会,同时也会有道德和法律的问题层出不穷,如何正确看待并让AI技术为我们所用是一项很有价值的讨论课题。

以上就是算力云今日分享内容,感兴趣的伙伴可以点个关注,留下你对Open AI文生视频大模型Sora的看法。