谷歌发布了一个非常牛皮的世界模型 Genie 3!
这次生成时长和分辨率都很给力,而且还支持通过文本动态改变世界事件,这搭配一个 LLM 不就妥妥的 AI 游戏吗
能以 24 帧每秒的速度生成,分辨率高达 720P,支持超过几分钟保持环境一致性
https://t.co/TC1AFPZC72
模型能模拟自然现象,并展现真实世界的物理特性。
支持跨越地理和时间界限,生成如阿尔卑斯山、威尼斯、古希腊等多样场景
通过自回归方式逐帧生成,Genie 3 能在几分钟内保持环境物体和细节的一致性,视觉记忆最长可达一分钟。
不仅支持导航,还能通过文本 prompt 动态改变世界事件
可为 AI 智能体(如 SIMA agent)生成丰富环境,支持复杂目标的达成和长期任务训练。
详细介绍:https://t.co/L2XZiYCF42
跟谷歌其他视频模型的对比 https://t.co/u3MBTRxzy0

真实世界物理属性建模 https://t.co/d40CRYOtSf
生成充满活力的生态系统,从动物行为到复杂的植物生命 https://t.co/TH6FbO1TpZ
发挥想象力,创造奇幻场景和富有表现力的动画角色 https://t.co/TTZndACyi9
Genie 3 环境仍能在几分钟内保持较大程度的一致性,视觉记忆最长可追溯到一分钟之前。 https://t.co/hfKZ4puxRM
谷歌员工日常也玩:https://t.co/kMcE4h03p8
卧槽,这个物理表现,注意看鞋子踩到水的时候
https://t.co/zoMCHGkShQ