谷歌发布基础世界模型，能生成可交互虚拟世界

ctrlCV 2024-03-25 10:00:38  13876 赞同 0 反对 0

分类：资源标签：信创资讯

日前，谷歌DeepMind团队方面公布了全新的AI基础世界模型Genie（精灵）。据了解，Genie拥有110亿参数规模，能够基于用户输入的合成图像、照片、草图等提示，生成像电子游戏一样可以进行互动、游玩的虚拟世界。但截至目前，Genie仅为研究预览版，尚未真正发布。

据了解，Genie的数据集主要是长达20万小时的公开互联网视频，其中重点是2D游戏与机器人视频。同时谷歌方面也表示，“我们的方法是通用的，适用于任何类型领域，且可以扩展到更大的互联网数据集”。

值得一提的是，Genie是在无监督和无标注的情况下进行训练，其可以专门从互联网上的视频中学习控制细粒度，即不仅能识别出哪些图像元素是可控的，还能推断出在生成环境中的潜在动作，并确保这些动作在它创造的不同环境中保持一致，这种潜在动作甚至还可以转移到人类设计的环境中。

据悉，Genie是由三个部分组成，其中包括一个潜在动作模型（Latent Action Model、LAM）、用于推断每对帧之间的潜在动作，一个视频分词器（Tokenizer）、用于将原始视频帧转换为离散token，一个动态模型、用于在给定潜在动作和过去帧token的情况下预测视频的下一帧。

对此Genie团队的负责人Tim Rocktäschel表示，“Genie作为基础世界模型，是人类迈向AGI的旅途中非常重要的一步”。英伟达高级研究科学家、通用具身智能体（Embodied Agent）研究小组负责人Jim Fan也表示，“Sora很好，但是Genie将会是具身智能体的主干之作”，以及“与Sora不同，Genie实际上是一个由行动驱动的世界模型，具有推断行动的能力。2024年也将是基础世界模型之年”。

如果您发现该资源为电子书等存在侵权的资源或对该资源描述不正确等，可点击“私信”按钮向作者进行反馈；如作者无回复可进行平台仲裁，我们会在第一时间进行处理！

评价 0 条

相关资源

《公共数据授权运营平台技术要求》团体标准发布稿 2023-11-30 13480 浏览
本标准定义了公共数据授权运营平台参考架构，围绕数据登记、授权、流通全流程，从功能、性能、运维、安全和互联互通等五个方面明确了平台相关技术要求。本标准的发布推出，对规范公共数据授权运营平台建设、激发公共数据要素价值、促进数字经济健康发展具有一定积极作用。
ZKWeb网页框架3.0正式发布 2023-12-31 13591 浏览
3.0 更新的内容有
新时代软件正版化创新发展大事记正式发布 2023-12-21 14136 浏览
新时代软件正版化创新发展大事记正式发布
Java 21重磅发布，史诗级增强，来看看究竟有多快？ 2023-12-30 14407 浏览
从今年年初就一直在喊的具有革命性、未来性、开创新纪元的 JDK 21，正式发布了！
Docker 引擎 - 发布渠道 2023-12-29 13667 浏览
Docker 引擎具有下面 3 个更新渠道： stable， test 和 nightly：
微信 8.0.42 正式版发布，主要更新功能一览 2023-12-21 13445 浏览
安卓微信 8.0.42 正式版也更新了，这次的软件包大小为：249.75MB，下面简单介绍一下具体都更新什么功能！
信创工委会发布《常用软件适配清单》：15个软件类别共计150款产品 2023-12-22 13747 浏览
重磅！信创工委会发布《常用软件适配清单》：15个软件类别共计150款产品
K8s + SpringBoot实现零宕机发布 2023-12-30 13631 浏览
前言 K8s + springBoot实现零宕机发布：健康检查+滚动更新+优雅停机+弹性伸缩+Prometheus监控+配置分离（镜像复用）
手机技巧：微信发布 8.0.35 安卓内测版，一起来体验一下吧！ 2023-12-25 13035 浏览
今天给大家分享微信官方团队于4月11日晚上发布的安卓版微信8.0.35（内测版），距离上个安卓微信内测版本更新仅仅相隔了一个月左右的时间，下面给大家介绍一下本次版本更新的内容，大家一起来看看吧！微信官方介绍，微信最新的这个版本将带来更快、更稳定的使用体验，也提供了一些实用功能。具体功能大家安装体验就可以了。
电脑技巧：PC 微信 3.9.2 正式版发布，快来看看更新的内容吧！ 2023-12-25 14603 浏览
近日，腾讯微信团队悄然发布了 PC 微信 3.9.2 正式版，该版本变化不多，主要是更新了微信收藏界面 UI，使之风格与手机端微信更加统一。