GDC独家:我们深度体验了最新的RTX AI技术,并看到了AI游戏的未来

作为上半年全球游戏开发圈最重要的活动,今年的GDC(游戏开发者大会)弥散着一股革命前夕的气息。或许身处游戏业的你已经感同身受,这个革命的诱因便是AI。

具体到今年的GDC的现场,很多演讲与产品技术演示都与AI有关。特别是GDC前夕,身为AI浪潮中的弄潮者之一的NVIDIA举办GTC 2024,NVIDIA创始人兼首席执行官黄仁勋在演讲中又投下了数枚核弹,全新Blackwell架构的GB200带来了预料之外的AI算力提升,新的人形机器人项目和数字人技术也让人嗅到了“次世代”的味道。这些前沿科技资讯层层叠加,进一步引爆了参会人员的热情。

游研社前方记者也在现场感受着这种氛围,并深度体验了一次AI在游戏中最前沿的应用。

GDC现场,一场题为 “使用AI让你的游戏角色栩栩如生”的NVIDIA演讲的门外排着长队

作为全球AI产业的基石,现在NVIDIA的一举一动都牵动着行业的视线。所谓的基石,既有硬件层面的,也有软件层面的。

硬件层面,有上面提到的目前最先进的GPU芯片GB200。GB200 NV72将成本和功耗降低了25倍,势必会成为各大AI公司争夺的硬件储备。在消费级市场,NVIDIA引以为傲的RTX AI 技术赋能AI PC概念,也成为了现在各大PC/笔记本厂商的最新卖点。在这一代GeForce RTX GPU的支持下,AI PC所支持的算力涵盖了200 到1300 AI TOPS的范围,而没有独立 GPU 的 AI PC 的算力仅为 10 至 45 AI TOPS。而在全新AI应用、软件AI功能的支持和用户体验上,NVIDIA更是凭借提前十几年的布局,早早构建了AI PC的领先优势。

但仅售卖芯片并不足以将NVIDIA推上现今如此超然的地位,其丰富的软件开发生态与硬件同等重要。今年NVIDIA主推的数字人技术其中的几项AI工具就包含了用于语音和动画的NVIDIA ACE 微服务、用于语音识别和面部动画的NVIDIA ACE 微服务、帮助开发者提供企业级生成式AI模型的端到端平台 NVIDIA NeMo 以及用于在游戏中实现实时路径追踪的渲染技术集合 – NVIDIA RTX。

这三者,共同构成了目前AI驱动的自然语言交互的数字人的基石,使其对话更逼真,表情更加生动。

对于游戏玩家而言,GDC上NVIDIA带来的并不只是《黑神话:悟空》和《永劫无间》将会支持全景光线追踪和DLSS 3.5,以及更多游戏将支持NVIDIA RTX技术,同时还有多家开发商联合制作的全新技术Demo。在这几个技术Demo中,我们可以更直观地体会到NVIDIA ACE等技术带来的变革。

当地时间3月19日,作为唯一一家受邀的中国媒体,我们在旧金山体验了NVIDIA的这几项最新的游戏AI技术。

在去到现场之前,我和NVIDIA的工作人员都不太确定我们会玩到什么,但这种新技术迫近的兴奋感,说不期待是骗人的。

这种兴奋感在踏入展厅的时刻被再次放大。这次的展示放在酒店的三楼,与其说是一个正式的展厅,倒不如说是一个严谨的黑屋测试。在一个不到票30平米的房间里,十多位工作人员严阵以待,七组不同的展示设备陈列在四周,在接下来的测试的一个半小时里,整个展厅同时参观的人数从没超过三个。

Covert Protocol演示Demo

NVIDIA x Inworld AI

当前两天 GTC放出和Inworld公司联合打造的基于NVIDIA ACE Covert Protocol NPC演示Demo时,一种跨时代的表现方式似乎真正在我们眼前展开:你可能已经在网上看到过这个技术Demo的片段,但我还是要在此分享一些我所体验到的细节。

这个Demo是一个技术演示,由Inworld AI与NVIDIA合作创建,它突破了NPC交互的界限。该技术演示使用Inworld的AI引擎,该引擎集成了Riva自动语音识别,可实现准确的语音转文本,以及NVIDIA Audio2Face提供逼真的面部动画。

在演示中,玩家扮演马库斯·皮尔斯,2062年的私家侦探,致力于揭开一家生物技术公司大亨的邪恶阴谋。本演示中有三个可互动的NPC,Tae Hyun、Sophia Anderson和Diego Menendez,他们具有独特的个性、动机,并根据为他们量身定制的背景故事提供完全动态的响应。你必须利用你的社交能力来获取你的目标Martin Laine的房间号,达成任务目标。

所有与NPC的对话交流,都是我通过麦克风来完成的。

现场的NVIDIA工作人员还鼓励你做更多的刁钻问题。每当我试图问出一些 “你家有几口人” 之类和游戏内容本身完全不搭界的话题,指导我的NVIDIA工作人员就会开始露出一副看好戏的表情:“让我们来看看会发生什么”。譬如这位大堂门口的酒店接待员,看起来心情不太好,但仍然试图保持对客人的礼貌,背地里他是一位家庭幸福的鸡尾酒爱好者,但如果你尝试问他的音乐喜好,他也能给出合理的回答。

这段简单的演示涉及了三个角色,接待员,前台女士,以及讲座的演讲者 Diego。基本的流程是,你与恪守用户隐私的前台女士Sophia互动却得不到答案,便需要转向忙于准备演讲的Diego试图套出更多信息,却会被残酷地拒绝并抱怨。

此时,当玩家在游戏中找到角落里的身份证明,就可以假装是某位与 Diego曾有交集的角色,并获得他的信赖。

这个过程实际上,是通过不断实时的自然语言交互,来让NPC的态度因为角色背景的转变而产生变化。相较于2月份发布的在拉面店互动的Demo,这是一个能够更全面看到NPC在AI模型加持下动态变化的过程,也是这次酒店Demo的意义所在。

在今年CES公布的NVIDIA 与 Convai联合打造的Demo中,玩家可以向拉面店主打听任务,也可以让店主给你做一碗拉面

GDC现场Demo是一个NVIDIA与和 Inworld AI引擎合作的技术服务,其中的NPC角色的一切特性,都可以通过Inworld AI引擎来做更细微的调整。开发者就像牵着所有NPC的 “上帝之手”,每一位NPC的性格、语气、说话方式、反应速度等参数都以具像化的滚动条的方式直观地展示出来。而玩家的语音识别与 NPC说话时候惟妙惟肖的面部表情和口型,则由NVIDIA ACE提供技术支持。

“如果我现在修改这里的参数”, NVIDIA工作人员指着Diego的六维指标告诉我 :“整个GDC会场的Diego就会突然用完全不同的方式说话。”为了让参与者尽快达成任务,Diego的角色在这次演示里被设计成会快速响应玩家身份的变化,如果在这里把角色的响应速度从快速拉到慢,那么 Diego可能就会和玩家打上好几个回合的太极。

这些NPC同时还拥有着长期记忆,玩家问过他们的问题,作出的选择,都可能会在遥远的将来成为重新击中玩家的子弹。在现行的游戏设计体系中,这一类反馈都基于预先设定好的 “故事树” 来展现,更茂密的故事线代表着玩家会拥有更多的可能性和互动,但未来,一切似乎都不必这么麻烦,AI的介入正在改变开发者的叙事生态,玩家们有机会真的玩出属于自己的 “哈姆雷特”了。

这似乎也昭示了更多的可能性:在将来的NPC角色似乎不仅仅在互动方面是灵动的,它的性格、说话方式、甚至身份也有可能随时发生变化,更像是一场 “沉浸式戏剧”了。据悉,中国各大游戏开发者正在开创性地利用 ACE 和生成式AI技术来改变游戏和应用中玩家与 NPC 之间的互动。其中包括:米哈游、网易游戏、完美世界游戏、掌趣科技、腾讯等国内游戏大厂。

NEO NPCs 技术Demo

NVIDIA x 育碧 NEO

在并不宽敞的现场有一个神秘的角落,是育碧使用 NVIDIA ACE所做的一款游戏技术Demo,名为NEO NPCs。现场两位负责此台机器的成员也摆出了相当谨慎的姿态观察着每一位靠近机器的陌生人,似乎在守护着自己的宝物。在现场的NVIDIA员工们似乎也达成了一定的共识,他们并不靠近育碧的角落,把一切交给育碧来演绎。

让我们回到演示本身。这段Demo确实值得此番隆重的保护:这是一个真正将游戏性与AI NPC结合在一起的案例,它同样拥有我刚刚所提到的NPC自由且多元的表达,但玩家需要通过和NPC不停的语音对话来提升好感度并获得下一个Checkpoint。

在试玩的第二个章节,是一个游戏中常见的 “设计入侵路线” 的情节,如何不惊动警卫从图书馆中入侵并脱逃。这里的解谜部分,是指要在悄悄潜入的条件下,完成三个不同的目标:爬上二楼,躲开警卫,避开监控器。只要符合 “潜入”的规则,你语音提出的提议都会被NPC欣然接受,成为最终行动的规划之一。为了熟悉游戏玩法,我在这三个步骤中都完成得很克制:爬上二层楼高的树,给警卫打了一枪麻醉针,以及关掉电源插头(这些步骤同样可以语音输入)。

按住LT输入语音

在完成这一切以后,游戏里的伙伴给了我一个最后的指令:在图书馆中脱身。根据地图的观察应该有很多选择:走快速出口,原路返回,或者其他比较体面的离开方式。但我想试试别的。于是我打开麦克风说:我决定从二楼跳下去。NPC大惊失色,但已经没法阻止我了。

结束这一章节之后,游戏中的伙伴对我的一切行动做了个简要的总结,当谈到我最终从二楼跳下的结局,他先是严厉地指责我不守规则,片刻之后又夸奖我勇气可嘉。似乎他的思维也在这个过程中做了一个简短的挣扎。

“The world is your oyster.” 在结束这部分试玩以后,法国小哥似乎对我刚刚的选择非常满意,以这句俚语结束了我们愉快的相处时光。

这是一句来自莎士比亚戏剧《温莎的风流妇人》中的台词,意思是 “这个世界是一个供你尽情挥洒的舞台”。

NEO NPCs由育碧巴黎工作室与Inworld和NVIDIA合作研发,其中,Inworld角色引擎和 LLM 技术使育碧的叙事团队能为每个 NPC 建立完整的背景、知识库和对话风格,而NVIDIA ACE 技术套件中的 NVIDIA Audio2Face 则用于实现实时面部动画。

结语

在一个半小时的体验中,我能感觉到与过去实验性质的AI游戏项目最为不同的两点在于,一个是技术上的成本与门槛被大为降低:由于NVIDIA ACE提供了现成的,基于生成式AI的自然语音识别与即时面部表情处理,这方面的成本被大幅度降低(以前所有NPC的面部表情和口型都需要开发者手动调整)。

>
dth="500" height="281" controls="controls" controlslist="nodownload" webkit-playsinline="true" playsinline="true">

另一方面,由于采用了混合式AI处理,一部分运算靠本地GPU来执行,一部分则放到云端,现场体验的延迟也大为降低。相比之前市面上演示的完全基于云端、每句话都要等一段时间的AI对话,GDC现场的AI NPC的对话延迟已经降低到了几乎能被视为正常游戏演出的地步,这是一个非常大的技术飞跃。

难以想象,未来待AI技术进一步成熟,将会在游戏产业中催化出多少崭新的体验。毕竟游戏是距离“数字人”最近的一种文化载体,从几十年前,玩家就能自然而然地联想到“如果NPC更像真人就好了。但游戏玩家也深知游戏中的AI角色并没有那么容易实现,无数技术难题有待解决。而这次演示,便向外界展示了目前的技术力所能抵达的阶段性目标。

这也不由得让人期待,NVIDIA下一个阶段的RTX AI PC将会给我们带来怎么样的惊喜了。

热门相关:北宋大丈夫   幻想世界大穿越   恐怖复苏   侯门弃女之妖孽丞相赖上门   驭房有术