微软支持的 OpenAI 在 14 个月前发布的ChatGPT 改变了人们对计算机功能的期望。 自那以后,谷歌一直在奋起直追,于 12 月推出了 Gemini 系列机型。 它们是多模态大型语言模型,可以通过语音、图像和文本与您交互。 谷歌声称,其自己的基准测试表明,Gemini 在一系列标准测试中可以超越 OpenAI 的多模态模型 GPT-4。 但利润微乎其微。
通过将 Gemini 融入到其无处不在的产品中,谷歌希望能够收复失地。 谷歌副总裁兼 Google Assistant 和 Bard(现为 Gemini)总经理 Sissie Hsiao 在昨天的新闻发布会上表示:“每次发布都很重要,但这次是迄今为止规模最大的一次。” “我们认为这是我们推进公司使命的最深刻的方式之一。”
但有些人需要比其他人等待更长的时间才能玩谷歌的新玩具。 该公司已宣布在美国和东亚推出,但没有透露 Android 和 iOS 应用程序何时登陆英国或欧洲其他地区。 罗马尼亚政治家、欧洲议会议员、该法案的主要谈判代表德拉戈什·图多拉什 (Dragoş Tudorache) 表示, 这可能是因为该公司正在等待 欧盟新的人工智能法案的落实。
“我们正在与当地监管机构合作,确保我们在扩张之前遵守当地制度的要求,”萧说。 “请放心,我们绝对正在努力,我希望我们能够非常非常快地宣布扩张。”
你怎么能得到它? Gemini Pro 是 Google 的中间层模型,自 12 月以来一直通过 Bard 提供,并将继续在gemini.google.com(而不是 bard.google.com)上免费提供。 但现在也有一个移动应用程序。
如果您有 Android 设备,则可以下载 Gemini 应用程序或选择在 Google Assistant 中进行升级。 这将让你以与使用 Google Assistant 相同的方式调用 Gemini:按下电源按钮、从屏幕一角滑动或说“嘿,Google!” iOS 用户可以下载 Google 应用程序,其中现在包含 Gemini。
Gemini 会在您的屏幕上以覆盖层的形式弹出,您可以在其中向其询问问题或向其提供有关手机上当前内容的说明,例如总结文章或为照片生成标题。
最后,谷歌推出了一项名为 Gemini Advanced 的付费服务。 该服务捆绑在每月 19.99 美元的订阅中,该公司称之为 Google One Premium AI Plan。 它结合了现有 Google One Premium 计划的福利(例如 2TB 额外存储空间),并且首次可以访问 Google 最强大的型号 Gemini Ultra。 这将与 OpenAI 的付费服务 ChatGPT Plus 竞争,后者可以让您每月花费 20 美元使用更强大的 GPT-4(而不是默认的 GPT-3.5)。
很快(Google 没有具体说明具体时间),此订阅还将在 Google 的 Workspace 应用程序(例如 Docs、Sheets 和 Slides)中解锁 Gemini,它可以作为智能助手,类似于 Microsoft 正在开发的基于 GPT-4 的 Copilot。在 Office 365 中试用。
什么时候可以拿到啊? 免费的 Gemini 应用程序(由 Gemini Pro 提供支持)从今天起在美国提供英语版本。 从下周开始,您将能够在整个亚太地区以英语、日语和韩语访问该网站。 但目前还没有关于该应用程序何时登陆英国、欧盟国家或瑞士的消息。
Gemini Advanced(可访问 Gemini Ultra 的付费服务)在 150 多个国家/地区提供英语版本,包括英国和欧盟(但不包括法国)。 谷歌表示,它正在分析当地的要求,并根据不同国家的文化差异对 Gemini 进行微调。 但该公司承诺将推出更多语言和地区。
你能用它做什么? 谷歌表示,它在 100 多名测试人员和高级用户的帮助下开发了 Gemini 产品。 在昨天的新闻发布会上,谷歌高管概述了一些用例,例如让 Gemini 帮助撰写求职信。 “这可以帮助你显得更加专业,并提高你与招聘人员的相关性,”谷歌负责产品管理的副总裁克里斯蒂娜·贝尔(Kristina Behr)说。
或者你可以拍一张爆胎的照片,然后询问 Gemini 如何修复它。 一个更详细的例子涉及双子座为足球队孩子的父母管理零食轮班表。 双子座会制定一个时间表,规定谁应该带零食以及何时带零食,帮助您向其他父母发送电子邮件,然后回复他们。 Behr 表示,在未来的版本中,Gemini 将能够利用 Google Drive 中的数据来帮助管理比赛时间表的拼车。
但我们应该期望人们自己想出更多的用途。 “我真的很高兴看到世界各地的人们将如何挑战人工智能的极限,”Hsaio 说。
安全吗? Google 一直在努力确保其产品可以安全使用。 但无论进行多少测试都无法预测技术 发布后 会被使用和滥用的所有方式。 在过去的几个月里,Meta 看到人们使用其图像制作应用程序制作了米老鼠拿着枪和海绵宝宝驾驶喷气式飞机撞向两座塔的照片。 还有人使用微软的图像制作软件来制作 泰勒·斯威夫特的假色情图像 。
《人工智能法案》旨在缓解部分(但不是全部)这些问题。 例如,它要求像 Gemini 这样强大的人工智能制造商建立保障措施,例如为生成的图像添加水印以及避免复制受版权保护的材料的步骤。 谷歌表示,其产品生成的所有图像都将包含其 SynthID 水印。
和大多数公司一样,当 ChatGPT 到来时,谷歌也被打了个后脚。 微软与 OpenAI 的合作使其比老对手有了更大的优势。 但凭借 Gemini,谷歌强势回归:这是这一代技术迄今为止最巧妙的包装。
更正:我们更清楚地表明,您需要订阅才能访问文档 和 Gmail 中的 Gemini。