AI 见闻

精灵计划:实验无限的互动世界

Google DeepMind Blog··约 5 分钟阅读

精灵计划:实验无限的互动世界八月,我们预览了《Genie 3》,这是一个能够生成多样化交互环境的通用世界模型。即使在这种早期形式中,值得信赖的测试人员也能够创建一系列令人印象深刻的迷人世界和体验,并发现了全新的使用方法。

下一步是通过专注于沉浸式世界创建的专用交互式原型来扩大访问范围。从今天开始,我们将为美国的Google AI Ultra订阅者推出Project Genie的访问权限。S(18+)。这个实验性的研究原型可以让用户创建,探索和重新组合他们自己的互动世界。

我们如何推进世界模式世界模型模拟环境的动态,预测环境如何演变以及行为如何影响环境。虽然Google DeepMind拥有针对国际象棋或围棋等特定环境的代理历史,但构建AGI需要能够驾驭现实世界多样性的系统。

为了应对这一挑战并支持我们的AGI使命,我们开发了Genie 3。与静态3D快照中的可探索体验不同,《Genie 3》在您移动和与世界互动时实时生成前方的路径。

它模拟动态世界的物理和交互,而其突破性的一致性可以模拟任何现实世界的场景--从机器人和建模动画和小说,到探索地点和历史背景。

在我们与来自各个行业和领域的值得信赖的测试人员进行的模型研究的基础上,我们正在通过实验研究原型迈出下一步:Project Genie。

Project Genie如何运作Project Genie是由Genie 3、Nano Banana Pro和Gemini提供支持的原型网络应用程序,它允许用户亲身体验我们世界模型的沉浸式体验。

体验集中在三个核心能力上:1.世界素描通过文本和生成或上传的图像进行提示,以创建生动、扩展的环境。创造你的角色、你的世界,并定义你想要探索它的方式--从步行到骑马、从飞行到驾驶,以及其他任何内容。

为了更精确的控制,我们将“世界素描”与Nano Banana Pro集成。这允许您预览您的世界将是什么样子,并修改您的图像以在进入之前微调您的世界。您还可以定义角色的视角(例如第一人称或第三人称),让您在进入之前控制如何体验场景。

2.世界探索您的世界是一个可航行的环境,等待着被探索。当您移动时,Project Genie会根据您采取的行动实时生成前方的路径。您还可以在穿越世界时调整相机。3.世界混音通过在现有世界的提示之上构建,将其重新融合为新的解释。

您还可以在画廊中探索精心策划的世界,或者通过选择随机发生器图标来获得灵感,或者在它们之上构建。完成后,您可以下载您的世界和探索的视频。我们如何负责任地建设Project Genie是谷歌实验室的一个实验研究原型,由Genie 3提供支持。

与我们在通用人工智能系统方面的所有工作一样,我们的使命是负责任地构建人工智能,以造福人类。由于Genie 3是一个早期的研究模型,因此有几个已知的领域需要改进:- 生成的世界可能看起来并不完全真实,或者总是严格遵守提示或图像或现实世界的物理学- 角色有时可能不太可控,

或者在控制过程中经历更高的延迟- 世代限制为60秒我们在八月份宣布的《Genie 3》模型的一些功能,例如在探索世界时改变世界的可预见事件,尚未包含在这个原型中。您可以在此处找到有关型号限制的更多详细信息以及有关我们如何改善体验的未来更新。

在我们与值得信赖的测试人员所做的工作的基础上,我们很高兴与我们最先进的人工智能的用户分享这个原型,以更好地了解人们将如何在人工智能研究和生成媒体的许多领域使用世界模型。Project Genie的访问权限今天开始向美国的Google AI Ultra订阅者1推出。

S. (18+),并在适当的时候扩展到更多地区。

我们期待看到他们创造的无限多样化的世界,随着时间的推移,我们的目标是让更多用户能够使用这些体验和技术。

原文出处
Project Genie: Experimenting with infinite, interactive worlds

本文为机器翻译辅以 AI 润色,仅供参考。原始事实以原文为准。