GPT在Gemini中徘徊-人工智能之幽灵 (gpt在各行各业有什么用法)
Google Gemini:与 OpenAI GPT 的较量与争议
引言
在生成式人工智能领域,每一项重大突破都会引发一股隐秘却强大的情绪力量:隐忍、不甘和较量之心。Google 也不例外,其在大型语言模型 (LLM) 领域的最新成果——Gemini 模型——正是这种较量的心态的产物。
Gemini 的发布与目标
2023 年 5 月的 Google I/O 大会上,Google 发布了 PaLM 模型系列,以对抗当时势头正猛的 ChatGPT。年底,Google 又出人意料地推出了一系列名为 Gemini 的 LLM,包括移动版 Nano、基础版 Pro 和高级版 Ultra。Google 官方宣称,在 32 项学术基准测试中,Gemini Ultra 在 30 项上超越了当时最先进的 GPT-4。
Gemini 标榜自己是真正的多模态模型,它从一开始就在文本、图像、音频、视频和代码等组合模式上进行预训练。由此推断,Gemini 在复杂理解和推理方面,特别是在解决数学和物理问题方面,可能会表现得更加出色。
多模态训练的优势与基准测试
Google 竭力强调 Gemini 的多模态训练优势,认为这能带来更强劲的性能。发布的 Gemini Ultra 学术基准测试结果似乎证实了这一点。
学术基准测试本质上只是理论上的,并不能真正反映实际应用的效果。批评者指出,不少中国 LLM 也热衷于基准测试刷分,而 Google 的做法与之并无本质区别。
社交媒体上的实际体验
在社交媒体平台上,实际测试 Gemini Pro(Bard 聊天机器人目前仅支持 Pro 版)的用户已经贡献了不少吐槽。例如,Gemini Pro 混淆了 2023 年和 2022 年的奥斯卡奖获得者,也无法使用 Python 编写一个简单的交集函数。它还无法识别叶子的数量,也不会做简单的锐角几何题。即使 Gemini Pro 针对的是 GPT-3.5,它仍存在明显的缺陷。
宣传视频引发的争议
另一个引人注目的问题是 Gemini 的宣传视频涉嫌造假。视频中,Gemini Ultra 对一组手势动作做出快速反应,并表示这是一个石头剪子布游戏。视频中未包含的提示文档却给出了至少两条提示:"我在做什么? 提示,这是一个游戏。"
其他一些测试也需要大量的提示性问题才能得出结果,但 Gemini 的官方视频却省略了这一过程。这很容易导致大多数不太细心的人高估 Gemini 的理解能力和反应速度。
Google 的 AI 乐观主义与夸大
2017 年 Google I/O 大会上,Google 员工通过 Google Assistant 语音助手直接预订餐厅的展示赢得了满堂喝彩。一个月后便传出这是一个事先安排好的桥段。
尽管 Google 并没有造假,但它总是过于渴望展示其 AI 能力的无与伦比,过于急切地呈现自己的 AI 乐观主义,以至于经常省略了背后过程,实际上夸大了效果。简而言之,Gemini 视频的夸大呈现,只是表明 Google 太在意 Gemini 是否比 GPT 更强。
与 OpenAI 的孪生关系
一定程度上,Google 是 OpenAI 在这个星球上唯一的孪生。Meta 的 LLaMA 架构是开源的,埃隆·马斯克对开源的支持使得 Grok 未来也可能开源。中国的 LLM 也在不同程度上走向了开源道路。只有 OpenAI 和 Google 坚定地坚持闭源,这使得 Google 在 LLM 上的进展本能地与 OpenAI 形成了一种紧密的联系。
每次 OpenAI 在 GPT 上有所动作,都会引起舆论的强烈反响。这种戏剧性的张力源于以下原因:
OpenAI 使用 Google 开发的 Transformer 架构创建了划时代的 GPT 模型,其部分动机是摆脱 Google 无处不在的 AI 压制。
Google 和 OpenAI 是唯一坚定闭源的 LLM 开发者。这种独特性使 Google 在 LLM 领域的进展与 OpenAI 产生了强烈的关联。
结论
Google Gemini 是 LLM 领域的一项重大进步,但它也并不是没有缺陷。社交媒体上的实际体验和宣传视频引发的争议凸显了 Google 在展示其 AI 能力时过于急切的问题。
尽管如此,Gemini 与 OpenAI GPT 之间的较量仍在继续,其最终结果将塑造 LLM 领域的未来。随着技术的不断发展,未来的较量肯定会更加激烈。
gemini没依赖英伟达芯片算力
谷歌:Gemini没有依赖英伟达芯片算力,该模型预计将在超过170个国家和地区提供服务。
这是一个重要的里程碑,因为它标志着谷歌在人工智能领域的最新研究成果。Gemini有望帮助人类通过阅读、过滤和理解海量信息。随着互联网上的信息量不断增加,人们很难从中找到真正有价值的内容。Gemini可以通过对大量文本进行分析和理解,帮助用户快速获取所需的信息,提高信息处理的效率。
同时,Gemini的推出也标志着算力国产化的拐点已经到来。Gemini并没有依赖英伟达芯片算力,而是由谷歌自研的TPU v4和TPU v5e训练出来的大模型。这一举措不仅给予了国内算力崛起的信心,也表明国内互联网巨头开始批量采购华为升腾、寒武纪等国产AI芯片。这将推动国内AI产业的发展,提升我国在全球人工智能领域的竞争力。
Gemini的价值主要体现在以下几个方面:
1、多模态融合:Gemini的设计从一开始就考虑到了多种模态的数据,如文字、图像、声音等,这使得它能够更好地理解和处理这些不同类型的数据,从而提供更丰富的信息和更准确的结果。
2、高性能:Gemini在各种基准测试中的表现都超越了现有的模型,如GPT-4,这证明了其在处理各种任务时的强大能力和高效性。
3、广泛应用:Gemini的应用范围非常广泛,包括科学研究、金融分析、代码生成等多个领域,这为各个行业的创新和发展提供了强大的支持。
4、免费服务:Gemini模型提供的服务是免费的,这使得更多的人和组织能够享受到先进的人工智能技术,推动了人工智能的普及和应用。
以上内容参考:网络百科-Gemini
免责声明:本文转载或采集自网络,版权归原作者所有。本网站刊发此文旨在传递更多信息,并不代表本网赞同其观点和对其真实性负责。如涉及版权、内容等问题,请联系本网,我们将在第一时间删除。同时,本网站不对所刊发内容的准确性、真实性、完整性、及时性、原创性等进行保证,请读者仅作参考,并请自行核实相关内容。对于因使用或依赖本文内容所产生的任何直接或间接损失,本网站不承担任何责任。