Sora视频生成效果炸裂,颠覆谁、利好谁?
2024-05-20 【 字体:大 中 小 】

没有任何预料,龙年伊始,投向市场一记惊雷的仍是AI。
春节假期尾端,OpenAI公布了其新一枚“王炸”级产品——Sora文生视频大模型,60秒的超长生成能力、逼真的视觉效果,让业内大呼人类与AGI的距离将被指数级压缩。
这仿佛梦回2023,由ChatGPT热所引发的AIGC朝拜一般。市场在春节前对于AI板块原本的犹豫、疑虑荡然无存,人工智能仍然牢牢坐稳摩尔时间。
从生成文字、图片上升到视频,OpenAI全面碾压同行。那么,Sora为AI产业注入哪些新动能,对于行业发展来说又意味着什么?
Sora横空出世,颠覆了谁?
在Sora横空出世之前,市面已流行多款文生视频大模型,例如Pika、RunwayML等等,但它们最多只能生成20秒的视频,均达不到像Sora一般的超长时长、世界模型、多镜头切换的特点,也不能保持高清的视觉质量。
同时,Sora还颠覆了业内的既往认知——多模态对于算力的耗费程度远大于纯文本生成。比如以Gemini为例,机构推测其参数规模至少达到万亿级别。而根据纽约大学谢赛宁推算,Sora参数量约为30亿。
产品效果如此惊艳、却又不会消耗大量GPU,Sora究竟是怎么做到的?综合业内的分析来看,Sora强大涌现能力的产生源泉有三:足量的数据、优质的标注、灵活的编码。据介绍,Sora在训练时可以不依赖于人工标注的数据,而是依靠机器的自我标注。同时,OpenAI搭建了一种新型的模型DiT(transformer + diffusion),而非依赖transformer这一单一技术架构。
至此,OpenAI已经横扫文生图(DALL·E3)、文本生成(ChatGPT)以及文生视频(Sora)三大核心科技。不仅如此,跟据《华尔街日报》最新报道,OpenAI CEO山姆·奥特曼正在推进一项雄心勃勃的计划,拟筹集至多7万亿美元,用于提高全球芯片制造能力。若筹资成真,将意味着OpenAI几乎全面占领AGI赛道中的所有关键卡位。
OpenAI的“野心”似已明朗,那就是做一个超级闭源的AGI巨无霸。面对一个冉冉升起的“科技巨头”,不少行业、个体将再次受到冲击。专家分析,Sora的诞生将首先对影视、广告、教育、游戏等多个行业产生直接影响。例如,视频创作者可以专注于更具创意性和战略性的工作,而将繁琐的重复性工作交给人工智能。
而在二级市场上,传统视频工具类公司均受到不同程度挫伤。例如,美股软件巨头Adobe在Sora发布次日暴跌超7%。据悉,Adobe的主要收入构成是数字媒体服务,包括对于视频、图片的二次加工、编辑,其中公众耳熟能详的Photoshop便是由Adobe出品。
(Adobe近日股价走势,数据来源:雪球)
为行业带来哪些新的思考?
目前,Sora尚处于定向邀请阶段,还未大面积向公众普及。专家预计,Sora全面推出的时间可能是在今年8月份。在这期间,一些和Sora高度同质化的公司仍将受到不同程度的冲击。
但是,新的机会也在孕育,新的理念正在形成。对于AI大模型领域来说,规模参数越大效果越好的既有观念被重新审视。如前文所述,Sora的参数仅为约30亿,但是其超强的生成能力却是有目共睹。
针对算力参数与模型性能的关系,百融云创(百融云-W,6608.HK)CEO张韶峰此前曾呼吁,对于行业大模型来说,需要警惕陷入“博算力”的误区。他认为,模型“大非万物”,重点是要寻求算力参数、用户意图与实时反馈之间的平衡。
“提升模型的响应速度、适度压缩算力成本,反而可以求得推理能力最优解,从而形成数据迭代、模型更新及用户响应的闭环飞轮。”张韶峰表示。
在张韶峰看来,在算力资源有限的情况下,通过模型优化和动态调整、提高算法效率、提升硬件适配度以及建立持续学习和自我优化的系统,通过用户的适时反馈来调整模型,便可以提高解决方案的准确性,最大化缔造AI技术的生产价值。
“大家都非常渴望大模型,反而会造成一种浪费。重要的是要在具体场景下彻底打通业务,形成一定的商业闭环。”张韶峰说道。
据介绍,百融云创于2023年打造了产业驱动大模型BR-LLMs,并自主构建了大模型预训练、微调、推理工程优化、应用开发套件等一整套技术栈。其中,以BR-LLM为基座的Cybertron平台内置丰富插件工具,对外输出Agent、Copilot等服务。
而除了和Sora颇为相似的“算力平衡”理念外,百融云创也并没有追逐LLM的单一力量,如前文所述,Sora的智能涌现力来自于LLM与diffusion的合力,而百融云创采用的是将决策式AI与生成式AI有机融合来为垂直行业提供AI产品服务和解决方案。
例如,在金融行业的智能营销领域,由于传统的营销方法耗时耗力,转化率受到制约。因此通过AI技术来提升营销效率成为普遍选择,但若仅仅依靠生成式AI技术效果却不尽如人意。
诚然生成式AI在个性化的信息推荐、营销活动响应方面存在诸多优势,但是由于缺乏前期的客户分析和行为预测,会使得LLM模型对于客户偏好和需求认识不足,不能有针对性的生成营销信息。金融机构甚至发现,投入大量成本开展营销的效果和不做一致。而融合了决策式AI的CRM系统可以将LLM模型功能的“天花板”被直接打开,大幅提升全客群模型的营销转化率。
Sora的问世带来了全新的憧憬和想象,标志着一个新的时代到来。分析人士认为,Sora将驱动AI大模型板块商业化落地加速,AI与场景的结合更为紧密,对于像百融云创这样深耕在垂直领域的AI公司构成行业性利好。

猜你喜欢

宁德时代:非常重视固态电池,最近加大了很多投入


邦达亚洲 欧洲央行会议纪要偏鹰 欧元小幅收涨


无锡股票配资 ,完善农业生产服务平台


来华签证费阶段性打75折!多项措施促进中外人员往来


中铁装配(300374)3月13日主力资金净卖出240558万元


百果园2023收入放缓:加盟店有所承压,遭多家机构下调盈利目标价


股票配资如何选择配资平台 ,湘投控股携752亿开局,湖南迎来省级能源集团,参股多家上市公司


一周大涨18%!奈飞(NFLXUS)成标普500“最靓的仔”,分析师承认“看走眼”


【不到4000元?努比亚竖折叠手机配置和价格曝光】 在MWC上,中国


酒钢宏兴(600307SH):控股股东酒钢集团首次增持131771万元股份


瑞幸咖啡四度携手消博会,“咖啡+”融合创新引领产业高质量发展


李子园是真的急了


惊!关税风暴席卷,美元信用崩塌倒计时?


印度电力股普遍下跌


一张图看18个直盘外汇支撑阻力:美元+欧系日系+商品货币+新兴货币(2025年5月5日)


ETF收评 A股三大指数缩量整理,新兴亚洲ETF放量大涨,多只溢价率高的跨境ETF回落,标普消费ETF跌324%


西南航空(LUVUS)激进股东Elliott披露持股细节 低于触发“毒丸计划”门槛


惠博普获得实用新型专利授权:“一种自动进出料的固控设备进料罐”


阿里巴巴:来自中国零售收入153679亿元 同比增长39%


国泰海通证券:在政策、情绪、供需催化下 稀土磁材板块行情有望迎来加速

瑞幸咖啡四度携手消博会,“咖啡+”融合创新引领产业高质量发展

李子园是真的急了

惊!关税风暴席卷,美元信用崩塌倒计时?

印度电力股普遍下跌

一张图看18个直盘外汇支撑阻力:美元+欧系日系+商品货币+新兴货币(2025年5月5日)

ETF收评 A股三大指数缩量整理,新兴亚洲ETF放量大涨,多只溢价率高的跨境ETF回落,标普消费ETF跌324%

西南航空(LUVUS)激进股东Elliott披露持股细节 低于触发“毒丸计划”门槛

惠博普获得实用新型专利授权:“一种自动进出料的固控设备进料罐”

阿里巴巴:来自中国零售收入153679亿元 同比增长39%

国泰海通证券:在政策、情绪、供需催化下 稀土磁材板块行情有望迎来加速
