谷歌AI眼镜上手体验：离完美只差一步

TechCrunch — AI·2 个月前·Sarah Perez·约 8 分钟阅读

在本周的谷歌I/O开发者大会上，我们有机会简短地体验了谷歌即将推出的人工智能眼镜--不是该公司表示将于今年秋天开始发货的纯音频眼镜，而是提供综合音频和视觉体验的眼镜。

这款Android XR眼镜在去年的活动中首次推出，提供镜头内显示屏，可以将有用的信息放在您面前，并覆盖在现实世界之上。这包括可以显示天气、步行方向、Uber接机详细信息、实时翻译等内容的小部件-甚至是您使用人工智能自己设计的小部件。

该公司指出，该眼镜还将与iOS和Android手机搭配使用，无论是纯音频格式还是未来的显示版本。带显示屏的眼镜将成为今年晚些时候推出的第一代音响眼镜之后的下一步。

该眼镜是与Warby Parker、Gentle Monster和三星合作开发的，将谷歌的技术与其品牌的设计美学融为一体。与此同时，我们测试的眼镜在很大程度上仍然是原型，尽管它的抛光程度足够，现在可以进行外部测试。

演示XR眼镜的代表解释说，原型让谷歌不必担心与不同风格和形状相关的一些外观细节，因此它可以专注于更自由地试验显示技术及其对电池寿命的影响。

这意味着这些眼镜与任何未来的运输版本的眼镜都有很大的不同，在适合性，形状，尺寸和对细节的关注方面。相反，它更像是能够在眼镜的“内部”进行实验，同时仍然处于基本的舒适框架中。该眼镜的发货版本将能够检测眼镜何时戴在头上并取下，但我们尝试的眼镜没有此功能。

要激活双子座，你执行两秒钟的新闻对眼镜的框架右侧。启动铃声响起，让您知道双子座正在收听。在演示版本中，启动Gemini也会同时启动相机，但发货版本将允许用户配置在Gemini启动时是否要打开相机。

在最初的测试中，我们通过眼镜播放音乐，要求双子座扮演最喜欢的艺术家。不幸的是，场地噪音太大，无法评估音质，因为音乐已调高到最大音量，仍然相对难以听到清晰和详细的声音。

但这种有限的体验给人的最初印象是，眼镜不会是更高质量耳机的好替代品，尽管如果您只是在户外、步行、徒步旅行或在家做家务时想要一些音乐，它们也可以。

与苹果AirPods等设备上的透明模式体验相比，不戴耳机的优点是，您可以更容易地听到某人说话。要关闭音乐，请在框架侧面的中间周围轻敲一次，就像轻敲您的寺庙一样。在第二个测试中，我们按下照片拍摄按钮来拍摄一张人的照片。

显示屏已关闭，因此图片被转移到我们的手机和手表上。(You稍后将能够通过长按来捕获视频，但该选项无法使用原型进行测试。对于视频，您会看到视频缩略图预览而不是照片。)您还可以简单地要求双子座拍照，而无需按下照片按钮，并对结果执行某种人工智能操作。

例如，你可以这样说：“拍一张照片，然后把这个人变成动漫角色。“照片被发送到手机，然后发送到Gemini和Nano Banana服务器，然后以编辑后的版本返回。在Google I/O场地，Wi-Fi负荷很大，往返大约需要45秒。

启用显示器后，您会看到一个简单的主屏幕出现在您的视野中。演示版本预装了一些小部件，可以显示天气和Google I/O活动的倒计时。您还可以将快速启动器构建到特定应用程序中，例如Google地图或Translate，如果这些是您的眼镜主要用例之一。

原型的右眼上方只有一个显示器，但该平台可以支持单显示器和双显示器，以及纯音频眼镜。图像本身有点模糊，但我们将其归因于我们的处方隐形眼镜，其中涉及一侧佩戴一个针对距离优化的镜片，另一侧佩戴一个针对近视力优化的镜片。

当我们闭上一只眼睛时，图像变得更好地聚焦，但这种经历几乎立即让我们右眼上方出现了一些眼睛疲劳，目前尚不清楚处方是否完全是罪魁祸首。最好的演示之一是眼镜上的语言翻译体验，该体验由手机上的Google Translate应用程序支持。

其中一名示威者说着流利的西班牙语，眼镜自动检测到语言并在显示器上显示英语文本，而双子座在我们耳边说英语。我们可以看到世界各地的旅行者购买眼镜只是为了这种体验。我们应该注意，Translate也适用于纯音频眼镜，只是眼镜上没有显示文本。

相反，除了实时音频反馈外，如果需要，您还可以在手机上看到转录。另一个演示涉及使用眼镜导航。虽然显然我们不能出去散步并离开场地来测试其准确性，但我们可以了解它是如何工作的。

您可以通过要求Gemini导航到目的地来开始Google地图体验--该目的地甚至可以像“最近的咖啡店”这样模糊。”双子座将在手机上激活谷歌地图，在体验加载期间短暂延迟后，眼镜将显示逐路方向。当您展望未来时，将会显示您的下一个转弯信息。

但如果您需要在太空中定位，请向下看地面，在地图上看到您的蓝点。您还可以左右转向以在空间中旋转，就像您试图让手机上的蓝点指向正确的方向一样。然后当你再次抬头时，你可以继续行走，而不会被地图挡住。

由于该体验与手机上的Google地图相关，因此保存的“家庭”和“工作”等目的地已经可用。我们还能够短暂地使用眼镜识别我们视野中的各种物体并提出有关它们的问题。

这款眼镜最初很难识别我们面前架子上的莫奈画作复制品，但那是因为原型并没有自动启用摄像头--它必须从应用程序中重新打开。尽管如此，在双子座说它看起来像莫奈之前，它还是问了几个问题，甚至在我们靠近并聚焦在左下方的莫奈签名之后。

其他测试更顺利，因为眼镜立即识别了架子上的植物，并回答了有关书中不同食谱的问题。

尽管如此，这些都是您今天可以使用Google Lens（或集成在聊天机器人应用程序中的其他人工智能模型）完成的事情，尽管我们认为无需拿出手机就能够完成这些事情是很有趣的。

谷歌表示，今年晚些时候，届时将扩大其值得信赖的测试计划，届时将有更多有关Android XR显示眼镜的信息分享。与此同时，该公司相信音频足以满足一些用户的需求，这也许是一种巧妙的方式来掩盖其显示眼镜尚未准备好的事实，尽管在这方面存在Meta和Snap的竞争。

与显示版本一样，音频眼镜还可以访问谷歌的Gemini AI，您可以通过眼镜的框架扬声器私下听到该声音。您可以通过眼镜听音乐、按下按钮拍照、拨打电话或从这些gl点击手机应用程序等操作

原文出处

本文为机器翻译辅以 AI 润色，仅供参考。原始事实以原文为准。

相关阅读