AI 见闻
精选· 重要性 4/5

Gemini Spark AI代理实测:效果惊艳但成本与隐私风险仍存疑

The Verge — AI··Jay Peters·约 8 分钟阅读
中文导读

谷歌发布24/7 AI代理Gemini Spark,实测显示其能自动完成多步骤任务,但高昂订阅费、隐私权衡及仍需人工核查的缺陷使其当前性价比存疑。

谷歌的新“24/7”人工智能代理Gemini Spark可以非常擅长代表您做事。但我不确定这是否值得付出财务成本和潜在的隐私权衡。Gemini的新AI代理与Google的演示一样好Gemini Spark令人印象深刻,但目前还不值得花这么多钱。

Gemini Spark令人印象深刻,但目前还不值得花这么多钱。该公司上周允许我访问Spark。谷歌将Spark宣传为一种人工智能代理,可以承担任务并在后台处理这些任务--甚至是具有多个步骤的任务--允许您放下手机或离开计算机。

它还在Spark网站的顶部宣称,它“始终在您的指导下”、“您选择打开它”以及“它的目的是在采取重大行动之前与您联系。“鉴于人们对人工智能的怀疑越来越多,我的‘不参与流氓人工智能’T恤让人们提出的问题已经得到了我的T恤的解答。

”我不知道该从哪里开始,所以我从同事Antonio的书中吸取了教训:我决定使用Spark来处理类似Google在I/O舞台上演示的任务。它在我的家庭办公室里会像在大舞台上一样有效吗?在I/O上,谷歌副总裁乔什·伍德沃德展示了一些不同的例子。

第一个是要求Spark起草一封发给谷歌团队的电子邮件,汇编有关Gemini Live发布和“上周获胜”的所有内容,并使用特殊的人工智能技能让这封电子邮件听起来像他。

谷歌要求谷歌为谷歌做事应该是世界上最简单的提升,所以我试图进一步推动它。我要求双子座起草一封给我妻子的电子邮件,其中汇总了我们2026年每月平均杂货支出总额。

我想这个测试会告诉我一些事情:Spark能否弄清楚我的妻子是谁(无需我透露Spark她的名字),它能否确定我们的预算电子表格在Drive中的位置(文件名中没有“预算”),它真的可以在Gmail中起草电子邮件吗?

不久后,当我从Spark那里得到结果时,我真的说:“哇,这实际上太疯狂了。

“Spark找到了我妻子的电子邮件地址,从我们的2026年预算电子表格中提取了正确的信息,抓取了每月的杂货总数,包括5月份的不完整数据(当我运行测试时,数据还没有结束),求出总数的平均值,并将其全部放入我Gmail中的电子邮件草稿中。

电子邮件文本以我妻子的名字发送给她,尽管她的电子邮件地址不包含她的名字。它甚至包括我们仅为彼此使用的签名。在他的下一个例子中,伍德沃德请求一些帮助规划街区派对。我不打算举办街区派对,但我用他提出的相同问题向Spark寻求帮助。

进展并不顺利。

它创建了一张朋友和家人的表格,作为“谁带了什么的高度现实的参考”,在我的Gmail中起草了一封电子邮件,提到了一个不存在的共享注册表,并创建了一个丑陋的平台,其中详细介绍了有关城市许可证的信息。

为了推送Spark,我要求它创建丢失的注册表,并添加到已经起草的电子邮件的链接。虽然Spark花了几分钟才弄清楚,但该任务确实有效;它创建了一个电子表格,然后返回电子邮件文本草稿并添加链接。伍德沃德的最后一次演示可以说是最令人印象深刻的。

他在Spark发表讲话,要求Spark做一系列事情:将他与首席执行官桑达尔·皮查伊(Sundar Pichai)的会面放在他的日历上,写一张纸条邀请他参加他的街区派对,并创建一份文件来帮助他的孩子们完成学年结束的待办事项。

对于我自己的版本,我要求它每个月在我妻子生日前举办一次日历活动,并将其变成粉红色,起草一封给我的家人的电子邮件,向他们发送最新一季《Taskmaster》的第一集,并创建一份包含我和妻子需要了解的重要信息的文档,让我们的孩子为学前班做好准备。

我于周五太平洋时间下午3:35开始了此请求。在I/O期间,伍德沃德做了一个表演,放下手机并承诺稍后在主题演讲中检查结果,他确实做到了。

但在解决了一个问题后-- Spark想访问我的联系人,但我拒绝了--大约四分钟后,我的任务就完成了。我再次对结果感到有点震惊,尽管它们并不完美:- 我的Google日历现在包含每月正确的一天上午9点至10点的活动,即我妻子生日前的每一天。

这些提醒是谷歌所说的“火烈鸟”,虽然不完全是“热粉色”,但已经足够接近了。- Spark抓取了我直系亲属的电子邮件,并将其放入电子邮件草稿中。(奇怪的是,它不包括我妻子的。

)电子邮件的文本正确无误地记录了最新一季《Taskmaster》第一集的名称,但链接到预告片而不是实际剧集。这封电子邮件还包括“loool”一词,这是我在随意的书面对话中写的。- Spark在我的Drive中制作了一个Google Doc,其中包含学前班准备清单。

然而,它只对我开放;我问Spark是否可以访问我的妻子,但它说目前无法做到这一点。Spark可能是一个强大的工具。但我应该提到一些警告。与所有人工智能工具一样,您仍然必须检查其输出以确保其准确性,当它从个人信息中提取您与认识的人分享的内容时,这可能会带来更高的风险。

尽管谷歌将Spark宣传为可以独立运行的东西,但我发现自己不断地观看它或检查它发送到我手机上的通知。

如果你必须微观管理他们的一举一动而不是信任他们,那么助理还有什么用呢?为什么我如此不确定的事情要耗尽资源匮乏的数据中心的电力来执行相对无关紧要的任务?目前,Spark仅适用于Google AI Ultra计划的订阅者,该计划起价99美元。

每月99,仅限美国用户,且仅限英语版本。谷歌为我提供了免费测试Spark的权限,但我认为这还不够好,不足以成为选择这些昂贵计划的唯一原因。特别是当我可以独自完成我要求Spark完成的所有任务时--它们只会花费更多时间。

如果您已经深入Google生态系统并启用了Personal Intelligence,Spark的效果也最好。我拥有Google帐户大约二十年了,因此Spark有大量数据可以用来提供答案。

但是,尽管谷歌承诺Gemini“不会在打开个人智能的情况下直接在您的Gmail收件箱上进行培训”,但您仍然必须相信谷歌将成为您数据的良好管理者。现在,我不确定这是否值得付出代价或冒险。最受欢迎- 美联航航班被迫掉头,

因为一个蓝牙音箱的名字- Nvidia宣布RTX Spark为“有史以来最高效的PC芯片”- 这是配备Nvidia RTX Spark的Microsoft Surface Laptop Ultra- 这些是第一款Nvidia RTX Spark笔记本电脑- 戴尔将重新推出

Xbox 13作为MacBook Neo的竞争对手-临时折扣至599美元

原文出处
Gemini’s new AI agent is about as good as Google’s demo

本文为机器翻译辅以 AI 润色,仅供参考。原始事实以原文为准。

相关阅读