当前位置:首页 > 数码 > 探索其非凡能力-奥特曼再放大招!OpenAI隆重发布首个文生视频模型Sora (探索其非凡能量的方法)

探索其非凡能力-奥特曼再放大招!OpenAI隆重发布首个文生视频模型Sora (探索其非凡能量的方法)

admin11个月前 (04-14)数码72

简介

北京时间16日凌晨,全球人工智能模型领跑者OpenAI推出了一款能根据文字指令即时生成短视频的模型,命名为Sora。此前在2023年轰轰烈烈的多模态AI模型竞赛中,谷歌、Meta和初创公司Runway、PikaLabs都发布过类似的模型。但本次OpenAI展示的视频仍然以高质量获得关注。

模型能力

  • 能够从文本说明中生成长达60秒的视频。
  • 能够提供具有多个角色,特定类型的动作和详细的背景细节的场景。
  • 能够在一个生成的视频中创建多个镜头,体现人物和视觉风格。
  • 能够一次性生成整个视频,也可以扩展生成的视频,使其更长。

突破性技术

OpenAI表示,通过让模型一次生成多帧画面,解决了以下挑战性问题:

  • 即使生成的主体暂时离开视线内,也能确保主体不变。

模型弱点

该模型可能难以准确模拟复杂场景中的物理现象,也可能无法理解具体的因果关系。例如:

  • 一个人可能会咬一口饼干,但咬过之后,饼干上可能就没有咬痕了。
  • 该模型可能混淆提示的空间细节,例如混淆左和右,并可能难以准确描述随时间发生的事件,例如跟随特定的摄像机轨迹。

安全问题

关于OpenAI的CEO山姆·奥特曼一直呼吁的AI安全问题,OpenAI表示:

  • 目前,Sora已经开放向“红队人员”(对AI大模型潜在的有害输出进行红队测试)以评估关键领域的危害或风险。
  • 我们还允许一些视觉艺术家、设计师和电影制作人访问,以获得关于如何改进模型的反馈意见,使其对创意专业人士最有帮助。

视频效果

OpenAI表示,Sora建立在过去对DALL-E和GPT模型的研究基础之上。它采用了DALL·E3的技术,能够在生成的视频中更忠实地遵循用户的文字说明。

除了能够文生视频外,该模型还能根据现有的静态图像生成视频,并能准确、细致地对图像内容进行动画处理。该模型还能提取现有视频,并对其进行扩展或填充缺失的帧。

目前OpenAI官网上已经更新了48个Sora生成的视频demo,色彩艳丽,效果逼真。

示范案例

几头巨大的长毛猛犸象踏着雪地走来,它们长长的毛发随风轻扬,远处是白雪覆盖的树木和壮观的雪山,午后的光线伴着飘渺的云朵和远处高悬的太阳,营造出温暖的光晕,低机位拍摄的景象令人惊叹,捕捉到了大型毛茸茸的哺乳动物,摄影和景深都非常漂亮。
一位时尚女性走在东京的街道上,街道上到处都是温暖的霓虹灯和动画城市标志。她身穿黑色皮夹克、红色长裙和黑色靴子,手拿黑色钱包。她戴着太阳镜,涂着红色唇膏。她走起路来自信而随意。街道潮湿而反光,与五颜六色的灯光形成镜面效果。许多行人走来走去。
阿马尔菲海岸教堂的鸟瞰图,教堂坐落在悬崖上,俯瞰着大海。天空是湛蓝色的,教堂的圆顶和钟楼清晰可见。海面上有几艘小船,海岸线上有几座房屋。

CEO在线接单

Sora公布后,OpenAI CEO山姆·奥特曼请社交媒体用户在线发送文字提示的创意内容。一位来自新罕布什尔州的自由摄影师在推特上给出的提示:

由一位祖母级社交媒体博主进行的自制意式团子烹饪指导课,场景设置在乡村风格的托斯卡纳乡下厨房,并配有电影级灯光。

奥特曼在约一小时后回复了一个逼真的视频。

业界观点

东吴证券观点此前表示,近年来视觉算法在泛化性、可提示性、生成效率和可控性上取得突破,视频生成效果快速提升。Sora的推出标志着AI视频生成技术迈出了重要一步。


童年回忆,你最喜欢看的动画片有.......

大闹天宫

1.解释:①少________②逸________③殊量________④纳________⑤既_________⑥

Sora

没将原文贴出,不免望文生义了!

①少:年轻或缺少②逸:舒适或闲适③殊量:非凡的器量④纳:接受或吸取,⑤既:既然

免责声明:本文转载或采集自网络,版权归原作者所有。本网站刊发此文旨在传递更多信息,并不代表本网赞同其观点和对其真实性负责。如涉及版权、内容等问题,请联系本网,我们将在第一时间删除。同时,本网站不对所刊发内容的准确性、真实性、完整性、及时性、原创性等进行保证,请读者仅作参考,并请自行核实相关内容。对于因使用或依赖本文内容所产生的任何直接或间接损失,本网站不承担任何责任。

标签: Sora

“探索其非凡能力-奥特曼再放大招!OpenAI隆重发布首个文生视频模型Sora (探索其非凡能量的方法)” 的相关文章

Sora开启文生视频新纪元-影视游戏产业加速变局求突破 (sora开启文生视频新纪元)

Sora开启文生视频新纪元-影视游戏产业加速变局求突破 (sora开启文生视频新纪元)

文生视频模型 Sora 的出现,掀起了一股人工智能浪潮,席卷了全球多个产业链,其中影视游戏产业首当其冲。Sora 母公司 OpenAI 与合作的艺术家发布了利用 Sora 制作的首部专业级艺术短片...

文生视频模型Sora-虚拟现实与人类存在的模糊界限 (七火山文生视频模型)

文生视频模型Sora-虚拟现实与人类存在的模糊界限 (七火山文生视频模型)

After the mind-bogglingimpact of OpenAI's large language model GPT-3, the company's latest crea...

Sora技术路途揭秘-伯克利出身的外围成员-变革性本文曾遇CVPR拒稿 (sora技术报告)

Sora技术路途揭秘-伯克利出身的外围成员-变革性本文曾遇CVPR拒稿 (sora技术报告)

最近几天,听说全环球的风投机构散会都在大谈Sora。自去年终引发全科技畛域军备比赛之后,曾经没有人情愿在新的生成视频赛道上落后了。 在这个疑问上,人们早有预判,但也始料未及:AI生成视频,...

经典文学作品 (经典文学作品有哪些书)

经典文学作品 (经典文学作品有哪些书)

在问世一年多后,target=_blankclass=infotextkey>OpenAI公司近期再次出招,推出文生视频大模型Sora。依据便捷的文本指令,Sora就能生成一段60秒的视频,...

绝妙逼真的音效打破无声电影-AI配音版Sora影片狂潮-或改写万亿美元产业 (绝妙的音乐)

绝妙逼真的音效打破无声电影-AI配音版Sora影片狂潮-或改写万亿美元产业 (绝妙的音乐)

导语:Sora之后,又一个突破!语音初创公司ElevenLabs放大招,直接用给Sora经典视频完成了配音。网友惊呼离AI完全生成电影又近了一步。 Sora的震撼效应 虽然一些人不想承...

技术报告-揭秘分布式账本和跨链互操作性的革命-人人都能看懂的-Sora (技术报告模版)

技术报告-揭秘分布式账本和跨链互操作性的革命-人人都能看懂的-Sora (技术报告模版)

引言 OpenAI 的 Sora 是一款创新的工具,定位为世界模拟器,旨在有效模拟物理和数字世界。作为视觉数据模型,Sora 具备视频生成、视频合成和图片生成等多用途功能。 核心功能...