下一代宇宙模子炸场,一张图生成无穷各样的 3D 游戏宇宙。
谷歌推出Genie 2,可反应键鼠操作,可玩、可纵容。
与此前研究比拟,Genie 2 领有始终驰念,即使玩家把视角转开,再回来时也可结识渲染宇宙中已存在的部分。
游戏宇宙中还不错有其他 AI NPC 存在,与玩家纵容的变装进行复杂交互。
这意味着任何东说念主王人不错用笔墨形容他们念念要的宇宙,选拔最心爱的呈现神志,然后插足这个宇宙并与之互动!
这下,千里迷《暗黑温情神 4》的马斯克王人以为很酷,随后 DeepMind 首创东说念主Hassabis邀请他全部作念个 AI 游戏。
重要马部长他还真搭理了~
集结马斯克此前宣称,xAI 将开办一家 AI 游戏责任室,两者联手的可能性还真不低。
不外谷歌 DeepMind 搞这项研究,可不光是为了给东说念主类玩游戏的——
AI 具身智能体,迈向 AGI 的阶梯
Genie 2 可用于考试和评估具身智能体,通过创建丰富各样的环境,不错生成 AI 在考试本领没见过的评估任务。
比如通过笔墨教唆,考试智能体掀开正确的门。
谷歌示意尽管这项研究仍处于早期阶段,在智能体和环境生成才能方面仍有多半校正空间……
但咱们笃信 Genie 2 是科罚在安全考试具身智能体的同期,中意杀青通往通用东说念主工智能(AGI)所需的广度和通用性条件。
此前,宇宙模子研究在很猛进程上仅限于建模一个忐忑的鸿沟,比如。
Genie 2 则完成了向生成丰富 3D 宇宙的飞跃,展示了宇宙模子的暴露才能,包括对象交互、复杂的变装动画、物理模拟,以及建模并磋议其他智能体步履的才能。
从吞并帧起程,但玩家的操作不同,不错生成不同的开放轨迹。
这意味着不错模拟反事实体验(counterfactual experiences)用于考试智能体,也等于从"假如其时继承另一种行径会若何"中得到训戒。
智能体还不错在 3D 宇宙中学会与其他对象交互,如气球挨打就会爆。
杀青这一切,靠的一经是扩散模子。
Genie 2 是一种自转头潜空间扩散模子,在大型视频数据集上考试。
(是谁领有 Youtube 里上亿小时的游戏视频数据,我不说)
进程自编码器处理后,视频的 Lantent frames 被传递到一个大型 Transformer 能源学模子,该模子使用与大型谈话模子相通的因果掩码进行考试。
在推理时,Genie 2 不错自转头神志采样,对单个操作和昔时的帧逐帧奉行,使用 classifier-free guidance 来莳植操作可控性。
此外,谷歌还显现,咫尺给出的视频示例王人是由为蒸馏的模子生成,以展示可能性。
蒸馏模子不错作念到及时纵容,但会裁汰输出质地。
One More Thing
就在 2 天前,
这个大佬们王人在押注的办法,的确要火了~
参考贯穿:
[ 1 ] https://x.com/elonmusk/status/1864388977866006639
[ 2 ] https://deepmind.google/discover/blog/genie-2-a-large-scale-foundation-world-model/体育游戏app平台