当前位置:首页 > 数码 > 中国版Sora争霸战-8款AI视频生成产品实测评 (中国版Sora模型是什么)

中国版Sora争霸战-8款AI视频生成产品实测评 (中国版Sora模型是什么)

admin7个月前 (04-14)数码74

引子

2024年开年,科技圈最振奋人心的消息莫过于Sora的出现。如同LLM创业潮在2023年初的席卷,Sora的发布将视频生成模型推向了风口浪尖,科技巨头与创业公司纷纷涌入。

DiT的创新

Sora的划时代意义在于践行了DiT架构,将扩散模型与大模型融合,开启了视频生成模型的新篇章。国内外视频生成大模型企业一览表如下:

国内外视频生成大模型企业一览表

产品实测

为了探究中国版Sora,我们对现有视频生成产品进行了实际体验,并结合公开信息和第三方检测机构数据,对主流视频生成模型进行了评估,从产品设计、实测效果和行业分析三个角度展开探究。

产品设计

目前国内视频生成创业公司大致分为两类:自研基础大模型的公司(爱诗科技、生数科技、MorphStudio、智象未来),以及专注特定场景的公司(右脑科技、李白AI实验室、毛线球科技)。

实测效果

在实测中,我们发现在通用场景下,爱诗科技的PixVerse表现优异,在场景衔接、人物动作和细节呈现方面均有出色表现。生数科技的PixWeaver在视频风格和创意性方面表现突出。MorphStudio的同名产品则在编辑功能和用户交互方面有较好体验。

行业分析

中国视频生成市场正在经历蓬勃发展,推动因素包括:海量中文文本和视频数据、高速增长的视频内容需求,以及政府对人工智能技术的大力支持。预计未来几年,视频生成模型将广泛应用于影视制作、教育培训、社交娱乐等领域。

中国版Sora的竞争格局

目前,国内视频生成领域内竞争激烈,但尚未出现明确的中国版Sora。爱诗科技坚持DiT路线,并定下超越Sora的目标。生数科技则专注于通用场景的视频生成,在创意性方面具有优势。右脑科技在特定场景生成方面有较强实力。

总结

视频生成模型正处于快速发展的变革风暴中,DiT架构的创新带来了无限可能。国内外的企业都在奋力追逐中国版Sora,竞争格局瞬息万变。随着技术、数据和算力的不断提升,我们期待着更多视频生成模型的突破,为各行各业带来新的赋能。


百度文心一言宣布向全社会开放,同时还有全新重构的 AI 原生应用,哪些信息值得关注? 实际使用体验

关于网络文心一言向全社会开放以及全新重构的AI原生应用,有几个值得关注的信息:

1. 网络文心一言开放:网络文心一言是网络开发的语义理解模型,通过对用户输入进行理解和自动生成文本响应。这个开放意味着网络将允许广大用户和开发者使用文心一言的功能,从而将语义理解技术应用于更多场景中。

2. 全新重构的AI原生应用:这意味着网络已经对其AI应用进行了全面的改进和升级,以提升用户体验和功能性能。具体来说,应用程序可能会经历界面设计、功能扩展、性能优化等方面的改进,以更好地满足用户需求。

我说说实际使用的一些体验:

识图回答

刚打开文心一言,第一个吸引到我的功能就是聊天栏上有一个上传图片的图标,我立刻选择了一张照片上传。之后就会弹出一些功能提示,包括:看图写诗、V50文案、朋友圈配文助手等等。我选了个配文助手,风格输入了轻松幽默。

好家伙,这一通浮夸的文案把我给震惊了,这配文简直是放飞自我了。不敢想象如果我把这篇文案发送到朋友圈,身边的人该怎么看我,吓得我只好告诉它请保持:高冷、简洁、少字。它也读懂了我的难为情,回了我八个字:享受美食、感受美好。妙哉妙哉!

发现:更多内置回答模板

移动端的发现功能应该说是文心一言最大的亮点,可以说是把AI使用的门槛降低了很多。之前我把用接口搭建好的网站分享给朋友,最大的问题就是别人不知道能问些什么,该怎么问,而文心一言就很好的解决了这个问题,把很多模型的能力场景化了。

从模态能力来看的话,主要包括文生文、文生图和图生文三种。先来一个小红书探店文案试试效果。

这个结果整体还是比较惊喜的,可以看得出来文心一言在Prompt工程上还是下了功夫的。基本满足了小红书探店文案的基本要素:格式、表情、标签,对关键词提取分析的能力还算可以。不过同时也尝试了下用这个Prompt去写其他类型的小红书文案,比如野餐,出来的效果就是完全没有效果。说明这个Prompt是专门针对探店这个场景优化过的,不具备能力的迁移。整体来讲Prompt的质量还不错,AI回答能力还算可以。

AI绘画

接下来测试一下AI绘画的能力,先来两个之前被吐槽过很久的绘画词语:车水马龙和红烧狮子头。之前据说画出来是car、water、horse、dragon,以及真正的狮子头,看看现在能力长进了没有。

令人惊讶的是,居然两个都画对了,不知道是翻译功能升级了还是绘画能力升级了,还是说针对性优化了,总之现在的槽点是少了很多(怎么感觉乐趣也少了哈哈)。

中国版Sora模型是什么

从绘画的理解能力和绘图出来的效果,应该说能打个及格分了现在,也不会期望它能画的多好,如果有什么文章需要配图的话,用这个来画也算是一个简单易上手的选择。但是,值得吐槽的是,每一张画作的右下角都会标注:AI作画,这个用起来有点难受,还得要自己P掉。

另外画作是不支持通过连续对话进行调整的,只能输入完整描述进行重新绘画。

代码能力

最后再来对比下文心一言的代码能力,这个属于是AI能力的重要体现,也是能作为生产力的重要一部分。

这里提了一个编写合并Excel文件的python代码需求,文心一言整体写得还算比较简洁优雅,回答质量和ChatGPT并没有太大的差距,属于还算是可以用的水平。(这里就不和GPT4进行比较了,肯定还是有些差距的)

总结

在我打算写这篇文章之前,我看过了很多关于文心一言使用的文章,其中不乏很多啼笑皆非的故事。本以为使用下来,应该会有满满的槽点,但是并没有。文心一言的能力固然和国外的大模型还存在着一些差距,但是这个移动端的App整体来讲做得还是比较有诚意的,整体使用非常顺滑,回答非常快速,拥有足够多高质量的Prompt模板,在问答之间会有很多贴心的提示,整体都带来了不错的体验。

魅族All in AI,汽车不造了?

爆了,真的爆了。

OpenAI的Sora一出,再次引爆整个人工智能行业。真的是一波未平,一波又起,ChatGPT的风还没过去,Sora的妖风就再次袭来,除了更加令人震撼之外,还带给人们不小的恐惧。

ChatGPT不必多说,人工智能大模型路线的关键推动者。看似是一款聊天机器人程序,却是一个能够完成大部分文字、设计、编程的全能生产力工具。

而Sora的出现,之所以依旧震撼人心,在于其好像真正理解了物理世界,并可以通过文字关键词,生成1分钟的逼真视频。

这代表着什么?

或许会有人说,Sora、ChatGPT再强,与我月薪3000有什么关系?但越是严重的影响,就越潜移默化。人工智能行业的持续迸发,不断释放生产力的同时,也是在不断抢占普通人的工作机会。

“单打一张AI牌没什么可怕的,可怕的是AI+。”

360掌舵人周鸿祎在Sora发布之后,发表评论称:这次Sora是小试牛刀,不仅仅是文生视频的能力,而是展现了对世界的理解和模拟,以后可能会有新的成果和突破。

知名媒体人胡锡进也对Sora发表观点:Sora的确是爆炸性进展。Sora的出现是人类AI技术新里程碑,对中国是新警钟。

爆炸性进展也好,新警钟也罢,人工智能对人们日常生活的渗透,已经超乎想象。而这里必须明确的一点:每个人,每家企业,都不能再对人工智能的突飞猛进,无动于衷了。

落后就要挨打。而对于这一情形,魅族或许是众多企业中,决心和积极性最大的那个。

2024年2月18日,魅族正式公告:魅族决定 All in AI,停止传统智能手机新项目,全力投入明日设备 AI For New Generations,以求迈入前景广阔的 AI 科技新浪潮。

是的,你没有看错,魅族也要像网络那样,All in AI。

新征程 or 炒冷饭

人们对于魅族的印象,或许还停留在手机等终端业务之上。而相比于苹果、华为、小米等强势手机厂商,混战的手机市场之中,魅族手机并不能更好的正向发展,所以才会有“吉利收购”一事。

从魅族手机,到星际魅族,魅族实现了面向汽车市场的关键一跃。原本还期待着魅族带着Flyme Auto在汽车圈大杀四方,这突如其来的All in AI,却是引得更多遐想。

魅族All in AI,并不是简单的跨界,而是面向未来的全新征程。

算法、算力、数据,是人工智能的3大基石。当大模型成为AI的主流发展方向,算力和数据的重要性,也就成指数级别增加。而这对于“软硬兼顾”的魅族来说,算得上是一个不错的切入点。

据魅族官方宣称:魅族将通过3年的生态布局和技术沉淀,逐步完成 All in AI 愿景。

而按照魅族的规划,2024 年魅族面向 AI 时代全新打造的手机端操作系统将进行系统更新,构建起 AI 时代操作系统的基建能力;此外,魅族首款 AI Device 硬件产品也将在今年内正式发布。

“魅族这是手机业务做不下去,All in AI炒冷饭,蹭Sora流量吧。”,不少网友对魅族All in AI的决心,不以为意,甚至有些冷嘲热讽。

其实也难怪网友这么想,毕竟魅族官方自己也这样说,“随着全球手机市场换机周期延长、消费创新空间有限、行业恶性竞争加剧,手机行业正面临着前所未有的挑战。”。

但不容置疑的是,困难的事总要有人去做。AI OS也好,AI Device 也罢,魅族始终想要的,就是面向未来的星辰大海,哪怕破釜沉舟。

那么问题来了:魅族All in AI,魅族汽车怎么办?

魅族官方承诺,在魅族 All in AI 的过渡期内,原魅族 Flyme、Flyme Auto、Flyme AR、MYVU、PANDAER,以及无界智行业务的用户体验及服务将不会受到影响。

换言之,与汽车业务紧密联系的Flyme Auto将会持续研发更新下去。至于魅族究竟会不会像小米一样选择亲自下场造车,这里可能还是要打一个大大的问号。

造车,但造不一样的车

与华为的“坚决不造车”,小米的“为小米汽车而战”不同,魅族进入汽车行业的阻碍,并不大。甚至在吉利汽车的倾情助力下,魅族更容易与现在的汽车市场,打成一片。

可能正是看到这一点,2023魅族秋季无界生态发布会上,星纪魅族集团董事长兼 CEO 沈子瑜正式宣布:将在 2024 年一季度启动 DreamCar 共创计划,为魅友们打造一款专属的 MEIZU DreamCar MX。

虽然发布会现场,沈子瑜并没有直言,究竟是要基于领克、极星的某款车型,打造一款MEIZU DreamCar MX,还是从头到尾,定义一款新车。但魅族进入汽车市场的决心,已经昭然若揭。

“吉利集团拥有从国际化设计,到汽车底层架构等等一系列核心能力,打通了汽车制造的全产业链布局;而星纪魅族已经在车机系统、汽车智能化上取得了进一步突破。”

正如沈子瑜所说,现在的魅族,已经开始在汽车市场上崭露头角。作为例证,领克爆款车型领克08,在Flyme auto的加持下,销量持续攀升,基本实现月销万台的成绩。

而且,同时发布的无界智行开放平台,更是推动了Flyme auto在汽车产品上的可拓展能力,不再局限于单一汽车品牌。

在个人看来,魅族造车其实是一件水到渠成的事。毕竟吉利旗下已经有诸多品牌,包括银河、极氪、极越等,少一个魅族汽车不少,但多一个魅族汽车却代表着更多的可能性。

国内跨界造车的例子有很多,包括和魅族一样的手机厂商小米、华为,也有老头乐公司雷丁、航空公司吉祥等。

但与这些企业相比,魅族的路子,显然更好走一些。

一方面,吉利现成的供应链体系、浩瀚架构、汽车技术可供使用;另一方面,智能驾驶、智能座舱等智能化功能,魅族也已经凭借吉利的平台,得到充分市场验证,可以直接实战。

实际上,万事俱备的魅族,只差一个造车的契机。

很显然,魅族虽然All in AI,但造车一事不会停。如果停的话,那就太浪费吉利的大好资源了。

当然,魅族造车必然不会造出另一个极氪,也不会是另一个银河。作为吉利旗下最具科技感的企业之一,魅族汽车的使命,更有可能“剑走偏锋”,成为一个比领克还要个性、自我、充满科技气息的新时代汽车品牌。

时来天地同借力,魅族的牌,其实还有很多没有打。

据了解,原魏牌CEO兼坦克品牌营销总经理陈思英已经官宣加入魅族,并担任星纪魅族集团高级副总裁、汽车事业部总裁,以及极星科技COO。

而当魅族集合了更多像陈思英这样“老汽车人”,当魅族汽车真正开始初露端倪,那么属于魅族的新纪元,也就正式拉开了帷幕。

免责声明:本文转载或采集自网络,版权归原作者所有。本网站刊发此文旨在传递更多信息,并不代表本网赞同其观点和对其真实性负责。如涉及版权、内容等问题,请联系本网,我们将在第一时间删除。同时,本网站不对所刊发内容的准确性、真实性、完整性、及时性、原创性等进行保证,请读者仅作参考,并请自行核实相关内容。对于因使用或依赖本文内容所产生的任何直接或间接损失,本网站不承担任何责任。

标签: Sora

“中国版Sora争霸战-8款AI视频生成产品实测评 (中国版Sora模型是什么)” 的相关文章

Sora开启文生视频新纪元-影视游戏产业加速变局求突破 (sora开启文生视频新纪元)

Sora开启文生视频新纪元-影视游戏产业加速变局求突破 (sora开启文生视频新纪元)

文生视频模型 Sora 的出现,掀起了一股人工智能浪潮,席卷了全球多个产业链,其中影视游戏产业首当其冲。Sora 母公司 OpenAI 与合作的艺术家发布了利用 Sora 制作的首部专业级艺术短片...

探索其非凡能力-奥特曼再放大招!OpenAI隆重发布首个文生视频模型Sora (探索其非凡能量的方法)

探索其非凡能力-奥特曼再放大招!OpenAI隆重发布首个文生视频模型Sora (探索其非凡能量的方法)

简介 北京时间16日凌晨,全球人工智能模型领跑者OpenAI推出了一款能根据文字指令即时生成短视频的模型,命名为Sora。此前在2023年轰轰烈烈的多模态AI模型竞赛中,谷歌、Meta和初创...

文生视频模型Sora-虚拟现实与人类存在的模糊界限 (七火山文生视频模型)

文生视频模型Sora-虚拟现实与人类存在的模糊界限 (七火山文生视频模型)

After the mind-bogglingimpact of OpenAI's large language model GPT-3, the company's latest crea...

Sora炸裂科技圈-真神还是焦虑制造机 (sora炸裂openai估值飙升)

Sora炸裂科技圈-真神还是焦虑制造机 (sora炸裂openai估值飙升)

作者:吴狄 出品:零态 LT(LingT_LT) 引言 周鸿祎又一次语出惊人。他声称,通用人工智能(AGI)的实现将从 10 年缩短到 1 年,而背后的原因仅仅是一个 1 分钟的短...

Sora超逼真视频引恐慌!Nature警示AI视频模型-社会-或在2024年颠覆科学 (超sos)

Sora超逼真视频引恐慌!Nature警示AI视频模型-社会-或在2024年颠覆科学 (超sos)

随着AI技术的飞速发展,文本转视频工具Sora的出现,使得生成逼真的视频变得更便捷。这种技术也带来了新的挑战和恐惧,影响着各个行业和社会层面。 社会恐惧 错误信息的泛滥: So...

绝妙逼真的音效打破无声电影-AI配音版Sora影片狂潮-或改写万亿美元产业 (绝妙的音乐)

绝妙逼真的音效打破无声电影-AI配音版Sora影片狂潮-或改写万亿美元产业 (绝妙的音乐)

导语:Sora之后,又一个突破!语音初创公司ElevenLabs放大招,直接用给Sora经典视频完成了配音。网友惊呼离AI完全生成电影又近了一步。 Sora的震撼效应 虽然一些人不想承...

打开并导入需要压缩的pdf文件-选择文件→优化pdf (打开并导入需要网络吗)

打开并导入需要压缩的pdf文件-选择文件→优化pdf (打开并导入需要网络吗)

引言 生成扩散模型在计算机视觉、自然语言处理等领域取得了重大进展。这些模型能够生成逼真的样本,且在多个方面优于其他生成模型。 生成扩散模型的原理 扩散模型包含两个过程:前向过程和反向过程。...