当前位置:首页 > 数码 > Emu-Edit-使用-探索人工智能图像编辑的无限可能 (EmuEdit)

Emu-Edit-使用-探索人工智能图像编辑的无限可能 (EmuEdit)

admin7个月前 (05-10)数码37

11月20日,Meta宣布为Facebook和Instagram推出两款基于文本的图像编辑工具,分别是EmuEdit和EmuVideo。这两款工具适用于照片和视频,Meta公布了更多相关信息,如下所述:

EmuEdit

Meta表示,EmuEdit模型仅使用文本指令就可以准确编辑图像。该模型接受用户指令,进行各种形式的编辑,包括:

  • 区域和全局编辑
  • 移除和添加背景
  • 调整颜色
  • 矢量图转换
  • 图像元素的检测和分割

Meta使用1000万个合成数据集训练EmuEdit,带来更好的图像编辑能力。该模型忠实地执行指令,产生比其他竞品更好的结果。

EmuVideo

EmuVideo是一种简单且高效的文本转视频生成方法。该方法运用扩散模型,并基于EmuEdit。EmuVideo能够处理各种输入方式,包括:

  • 文本
  • 图像
  • 文本和图像的组合

EmuVideo将影片生成过程拆分为两个步骤:

  1. 根据文本提示生成图像
  2. 基于文本和生成图像产生视频

这种拆分步骤的方法可以让研究人员有效地训练生成模型。EmuVideo比其他竞品更简单,仅使用2个扩散模型,就能生成512x512分辨率、每秒16FPS、长4秒钟的视频。

Meta援引评估数据,证明EmuVideo生成的视频品质以及遵循提示词的忠实程度相对业内竞品更好。在品质方面,有96%受访者偏好EmuVideo而非此前的Make-A-Video方案,而对于提示词的忠实度方面,EmuVideo获得了85%受访者的青睐。

EmuEdit和EmuVideo有望简化视频编辑任务,为用户提供更多功能和更高的精确度。这两款工具目前尚在开发中,Meta将在未来几个月内分享更多信息。


什么是人工智能?

使用

人工智能(Artificial Intelligence) ,英文缩写为AI。 它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。 人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。

人工智能可以代替人们做哪些事情?

AI语音互交

在我们每天使用的手机上,人工智能为我们提供AI语音如:Siri、小爱、天猫精灵等,让人工智能更好地读懂人类的语言,更流畅、跟准确的交流,提高娱乐性 同时让我们使用手机更加便捷安全。

中文典型的智能语音交互应用如:虫洞语音助手、讯飞语点已得到越来越多的用户认可。

人脸识别系统

例如苹果手机iPhone X于2017年9月发布,iPhone X采用了Apple A11仿生处理器、集合Face ID、无线充电等最新的AI嵌入。更精确与安全进行人脸识别。

苹果甚至开发了一个AI神经引擎,用神经网络处理图像和点阵模式,并邀请好莱坞特效面具公司,通过制作面具来训练神经网络的“聪明”程度。

人脸识别系统应用在车站安检区域,身份识别,人脸识别支付系统还有人脸识别门禁考勤系统,人脸识别防盗门。公安、司法和刑侦方面,如利用人脸识别系统和网络,在全国范围内搜捕逃犯。信息安全方面有,如计算机登录、电子政务和电子商务等。

AI无人驾驶技术

无人驾驶技术中自动泊车系统,自动泊车是无人驾驶技术的一大成就,并且已经在实施到车辆上。泊车是一种危险性较低的驾驶操作,但仍然会把事情搞得一团糟。

通过自动泊车系统车辆通过车身周围的传感器,可以像驾驶员那样观察周围环境,及时做出反应并安全地从A点行驶到B点。

AI技术在医学中的应用

AI技术在目标检测、影像分析、图形分割方面的能力。

可以用来解决医学影像中靶区勾画、器官分割、图形重建、病理切片分析等需求。

使医学在诊断方面比人类医生更加精准、更快地确立病因并给予诊断。

在手术方面通过数据化和3D技术,将传统的二维图像信息立体化、使医生病患分析和手术治疗更加轻重精确。人工智能技术正在不断改变外科医生的手术实践。

人工智能在医学中制药方面、耐药方面、康复方面等,都发挥着重要的作用。

AI+医疗现在已成为在医疗领域最热门的方向;人工智能技术已经成为医疗健康行业的有效辅助和有力支撑。但是在技术上缺乏行业标准及技术创新等问题,需要人工智能大量的人才进行技术创新。

智能家居

人工智能将走进我们的生活, AI语音控制可以让你在休息时为你提供相应的帮助, 例如:照明灯、咖啡炉、电脑设备、保安系统、暖气及冷气系统、视讯及音响系统等。 随着科技发展智能家居将更多地出现在我们的生活中,实现万物互联。

人工智能每一次发展都引起人们的兴趣和好奇,人工智能的种子刚刚萌发,通过不断的学习研究人工智能将会给社会带来更便捷的服务。

免责声明:本文转载或采集自网络,版权归原作者所有。本网站刊发此文旨在传递更多信息,并不代表本网赞同其观点和对其真实性负责。如涉及版权、内容等问题,请联系本网,我们将在第一时间删除。同时,本网站不对所刊发内容的准确性、真实性、完整性、及时性、原创性等进行保证,请读者仅作参考,并请自行核实相关内容。对于因使用或依赖本文内容所产生的任何直接或间接损失,本网站不承担任何责任。

标签: Meta

“Emu-Edit-使用-探索人工智能图像编辑的无限可能 (EmuEdit)” 的相关文章

Meta的开源人工智能音乐模型-全面解析 (META的开源大模型)

Meta的开源人工智能音乐模型-全面解析 (META的开源大模型)

簡介 Meta 的 MusicGen 是一個開源的人工智慧 (AI) 音樂模型,於 2023 年 6 月發布。它在多個方面取得了重大進步,包括: 使用更少的訓練數據 開源代碼和模型權重...