年生成式-2024-的六个前瞻性预测-AI (生成年龄的公式是什么)
随着 2023 年接近尾声,是时候展望 2024 年了。在涉及生成式人工智能时,我们很容易迷失在所有的可能性中 -我们在 2024 年可以现实地期待什么?
当然,我们将继续看到技术提供商对企业准备情况的关注,而通用人工智能的竞赛和愈演愈烈的人工智能芯片大战可能会成为头条新闻。但是,由于去年发生了如此多的变化,没有人确切知道该行业下一步将走向何方。
我对 2024 年的六项生成式预测都围绕着实用性:持续采用、多模态、开源、负责任的 AI、监管和组织曝光。
持续采用
对于行业来说,从生成式人工智能目前所处的炒作阶段到兴趣减弱的时期是很常见的:幻灭的低谷。也许实验失败了,或者业务方面没有足够快地看到价值,但这不会发生在生成式人工智能上。
我认为一些公司在将生成式人工智能纳入业务方面会失败吗?当然。生成式 AI 工具是否尚未为企业做好充分准备?确定。我认为现在有太多的模型可供选择吗?是的。但这些因素并不能阻止组织采用生成式人工智能。
这项技术在很多方面使企业受益的例子太多了,我认为我们已经接近主流采用。在我看来,有两个主要障碍可能会减缓采用速度:成本和监管。但鉴于开源人工智能的兴起,它正在推动当今的市场,我认为组织将比以往任何时候都更快地解决法规问题。随着技术提供商和供应商提供更高的成本透明度,我们将开始看到更实惠的方法。
多模态人工智能
多模态 AI 使最终用户能够以超越文本(例如图像、音频和视频)的方式与生成式 AI 进行交互。我们已经在这个领域看到了一些有前途的功能,包括谷歌最近宣布的原生多模态 Gemini,但我们才刚刚开始。
使生成式 AI 模型能够同时处理多种类型的输入,将显著改善响应,从而更好地感知上下文。例如,与 PDF、图表或图形交互的能力将帮助企业中的许多利益相关者。但最让我兴奋的是它对制造、工程和医疗保健等领域的潜在影响。想象一下,以对话的方式与原理图、蓝图或基因组学进行交互。
开源
当 ESG 询问组织他们计划如何开发或使用生成式人工智能时,超过三分之一的人表示他们计划使用开源大型语言模型(LLM)。这些组织希望通过整合自己的数据来控制、透明和定制开源模型的能力。这就是检索增强生成(RAG)的用武之地。
RAG 是一种技术,用于通过使用语义检索来引入特定内容(如企业数据)来解决幻觉和其他不准确问题。从长远来看,我相信当前的许多模型将在性能方面趋同,输出足够相似的响应,无论您使用哪种模型都无关紧要。区别因素将不再是模型本身,而是它们使用的数据——不仅是进入训练集的数据,还有通过 RAG 使用的数据。数据将成为组织最大和最重要的差异化因素。
负责任的人工智能
我们正在目睹主要联盟的形成,其目标是通过开放式创新提高负责任的人工智能能力。我们已经看到,在大公司内部形成了全新的业务部门,这些部门专注于责任和人工智能道德。
到 2024 年,我们将开始看到负责任的 AI 协议和最佳实践的标准化,重点是治理、安全、安保和信任。我认为我们在这方面有大量工作要做。太多推动生成式 AI 叙事的组织根本没有一个好的答案来应对负责任的 AI。它是一个内部管理机构,内部建立的东西,通过一个或多个合作伙伴填补的空白,还是上述所有?最后,还有我最喜欢的问题:负责任的人工智能是否需要成为一种产品或服务,或者它是一种必须灌输
2022年值得关注的5个AI趋势 – thenewstack
COVID-19 大流行加速了 2021 年人工智能或机器学习的采用。企业对自动化的需求以及人工智能硬件和软件的进步正在将应用人工智能变为现实。
以下是 2022 年的五种人工智能趋势:
趋势 1:大型语言模型 (LLM) 定义下一波对话式 AI
语言模型是基于自然语言处理技术和算法来确定给定单词序列在句子中出现的概率,这些模型可以预测句子中的下一个单词,总结文本信息,甚至可以从纯文本创建可视化图表。
大型语言模型 (LLM) 在包含大量数据的海量数据集上进行训练。Google 的BERT和 OpenAI 的GPT-2和GPT-3是 LLM 的一些例子。众所周知,GPT-3 在 570 GB 的文本上训练了 1750 亿个参数。这些模型可以生成从简单的论文到复杂的金融模型的任何东西。
包括OpenAI、Hugging Face、Cohere、AI21 Labs在内的AI 初创公司正在通过训练具有数十亿参数的模型来突破 LLM 的界限。
华为的PanGu-Alpha和网络的Ernie 3.0 Titan接受了包括电子书、百科全书和社交媒体在内的 TB 级中文数据集的训练。
2022 年,我们将看到大型语言模型成为下一代对话式 AI 工具的基础。
趋势二:多模态人工智能的兴起
深度学习算法传统上专注于从一种数据源训练模型。例如,
多模态 AI 是计算机视觉和对话式 AI 模型的终极融合,可提供更接近人类感知的强大场景。它将视觉和语音模式结合起来,将人工智能推理提升到一个新的水平。
多模式 AI 的最新示例是来自 OpenAI 的DALL-E,它可以从文本描述中生成图像。
谷歌的多任务统一模型 ( MUM ) 是多模式 AI 的另一个例子。它承诺通过基于从 75 种不同语言中挖掘的上下文信息对结果进行优先排序,从而增强用户的搜索体验。MUM 使用 T5 文本到文本框架,比 BERT(流行的基于转换器的自然语言处理模型)强大 1000 倍。
NVIDIA 的GauGAN2模型将根据简单的文本输入生成照片般逼真的图像。
趋势 3:简化和流线型 MLOps
机器学习操作 (MLOps) 或将机器学习应用于工业生产的实践非常复杂!
MLOps 是已纳入基于云的 ML 平台的概念之一,例如Amazon Web Services的Amazon SageMaker、Azure ML和Google Vertex AI。但是,这些功能不能用于混合和边缘计算环境。因此,边缘的监控模型被证明是企业面临的重大挑战。在处理计算机视觉系统和对话式 AI 系统时,边缘监控模型变得更具挑战性。
由于Kubeflow和MLflow等开源项目的成熟,MLOps 变得相当容易获得。未来几年,将出现一种流线型和简化的 MLOps 方法,涵盖云和边缘计算环境。
趋势 4:AI 驱动的低代码开发
人工智能将影响 IT 的编程和开发。
大型语言模型 (LLM) 的兴起和更广泛的开源代码可用性使 IDE 供应商能够构建智能代码生成和分析。
望未来,期待看到可以从内联注释生成高质量和紧凑代码的工具。他们甚至能够将用一种语言编写的代码翻译成另一种语言,通过将遗留代码转换为现代语言来实现应用程序现代化。
趋势五:新型垂直化人工智能解决方案
Amazon Connect和Google Contact Center AI是垂直整合的经典例子。两者都利用机器学习功能来执行智能路由、由机器人驱动的对话以及对联络中心代理的自动协助。
这些服务是为零售和制造垂直行业高度定制的。
什么是AI语音生成?
对音乐公司来说,AI语音生成已成为重要发力方向,不仅能提高音乐创作效率,还能打造虚拟偶像。 不过,对于音乐行业来说,数字音乐版权的规范化是大趋势,但也面临巨大的现实复杂性,只是AI的加速发展又带来了新的问题,流媒体UGC创作、翻唱侵权、短视频和直播侵权等,都需要重新进行梳理并确立新的规则。 科技巨头加码AI 初创公司连获融资无论如何,科技巨头都在加码对AI领域的布局。 随着投资者兴趣的提升,扎克伯格在今年2月宣布成立一支顶级生成式AI团队。 Meta首席技术官也明确承认生成式AI是目前他和扎克伯格花时间最多的领域,预计将在今年发布一款相关产品。 相比较之下,微软和谷歌等公司正在推动生成式AI产品的公开商用。 根据IDC的数据显示,全球AI市场规模在2019年已经达到了97.9亿美元,预计到2023年将达到206.6亿美元。 AI技术的应用范围也越来越广泛,包括医疗、金融、教育、零售等多个领域。 不少AI相关的初创公司也得到资本的青睐。 最新消息指出,继今年2月完成近千万美元A轮融资后,国内AI图像生成技术服务商Tiamat又融资了,这一次Tiamat获数百万美元A+轮投资,由线性资本领投,老股东DCM、绿洲资本跟投。 总部位于美国的人工智能初创公司Runway在D轮融资中筹集到至少1亿美元,估值由此达到15亿美元,这笔交易使这家初创公司的估值比上一轮增加了两倍。 与此同时,AI相关人才备受青睐。 脉脉高聘人才智库于3月底发布《2023AIGC人才趋势报告》,数据显示,今年1至2月国内AIGC(人工智能生成内容)招聘需求量同比上涨31.3%,创历史新高。 人才紧缺令热招岗位薪资水涨船高,其中图像识别、算法研究、深度学习岗位因技术难度较大、市场前景广阔而备受追捧。
免责声明:本文转载或采集自网络,版权归原作者所有。本网站刊发此文旨在传递更多信息,并不代表本网赞同其观点和对其真实性负责。如涉及版权、内容等问题,请联系本网,我们将在第一时间删除。同时,本网站不对所刊发内容的准确性、真实性、完整性、及时性、原创性等进行保证,请读者仅作参考,并请自行核实相关内容。对于因使用或依赖本文内容所产生的任何直接或间接损失,本网站不承担任何责任。