谷歌发布基础世界模型Genie,能一图创建互动的虚拟环境

据谷歌公司官网26日报道,谷歌旗下“深度思维”公司重磅发布了一个根据互联网视频训练的基础世界模型——Genie(精灵)。其可从合成图像、照片、草图生成多种动作可控的环境。
Genie效果的动图截图演示。
图片来源:谷歌官网
过去几年,生成式人工智能(AI)模型能通过语言、图像甚至视频生成内容。谷歌此次引入生成式人工智能新范式,即生成式交互式环境,通过单个图像提示即可生成交互式、动作可控的环境。
Genie是一个110亿参数的基础世界模型,在超过20万小时的二维(2D)游戏视频上进行训练,无需人工监督。这意味着Genie可以从视频中自行识别不同动作的特征和模式。其能学习各种角色的动作、控制和行动。
Genie的独特之处还在于它能够专门从互联网视频中学习细颗粒度的控制。Genie不仅能观察哪些部分是可控制的,而且能根据生成的环境来推测出多种潜在的动作。
该模型接受单个图像(无论是AI合成图像、照片还是草图),并将其转换为可玩的游戏,响应用户控件。从图像到基本的交互环境一步到位。
用户只需提供一张纸上的草图、一幅完美的数字艺术作品,甚至是AI生成对2D世界的描述,Genie就会完成剩下的工作,帮用户生成2D游戏。
谷歌官网称,Genie专注2D平台游戏和机器人技术的视频,但方法通用,应适用于任何类型领域并可扩展至更大的互联网数据集。只需一张图像就能创建全新的交互环境,这为生成和进入虚拟世界的各种新路径开启了大门。
本文链接:http://knowith.com/news-1-597.html谷歌发布基础世界模型Genie,能一图创建互动的虚拟环境
声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。
考研人数下降,“高学历”不卷了?
西安考研机构哪个靠谱(文都哪个比较好啊今年大三了)
邯郸市考研考点有哪些学校,华图考研机构邯郸有吗
考研更换报考点(考研更换报考点校验码什么时候出)
2015经济学考研:西方经济学模拟试题一答案
2015经济学考研:西方经济学模拟试题六
郑州考研学校排名(郑州大学研究生考试范围)
唐山考研在哪里考(唐山考研在哪里考好)
关注!23考研公布初试成绩排名的院校……
考研去福州大学怎么样_考研去福州大学怎么样啊
收到 羊小咩享花卡6000额度怎么提出来 最新提现方法最新套法来袭!
印度索拉非尼多少钱一盒?2025印度索拉非尼(多吉美120片)零售价格正常公布一览表:1200元一盒!新版印度索拉非尼哪里买购买攻略必知!
孜孜不倦:苹果id贷是真的吗,苹果id贷怎么样
现如今一盒印度阿伐曲泊帕价格究竟是多少?一文了解阿伐曲泊帕
欢天喜地:南昌新建区上门代还信用卡,分享四大方法,最新操作秒到方法
欢天喜地:青岛崂山区代还信用卡分享四大方法,最新操作秒到方法
验证:羊小咩享花卡额度怎么套出来– 3种方式详解
解读:西安灞桥套京东白条找旗舰店,成功后两分钟到账
百分百:武汉硚口旗舰店套花呗当面,十年商家当面操作
无证+醉驾!男子喝6瓶啤酒骑车带朋友游玩被查获,两年前曾被吊销驾驶证