贴吧用户_0AEW3CD 菊花塞高达
关注数: 69 粉丝数: 399 发帖数: 8,175 关注贴吧数: 169
我们距离构建一个逼真的虚拟世界还有多远 20世纪末电子游戏的普及让这种向往终于找到了理想的载体。信息技术的蓬勃发展,使得游戏内容的制作越发精良、越发能调动起玩家的视听感官;而硬件与通讯的进步,降低了进入游戏的时空成本。现实世界的文明一步步走向了虚拟化,充满实感的游戏内容则从虚拟世界中不断脱出,两者的边界日益模糊。 但人们并未满足于此。找到钥匙打开机关,使用魔法破解谜题,拾取装备武装自己,提升等级战胜怪物,送礼物提升NPC好感度,一切都在千篇一律、按部就班地发生。人们想要在虚拟世界里感受更多的真实、获得更大的自由。 《塞尔达传说》里的“炸鱼” 大规模体现在空间层面。意味着整个世界的巨大复杂性,广阔的地图,大量的角色,丰富且充满细节的可交互物和交互方式。 然而,这两者还只是基础,我们已经在开放世界里见到了大规模、在MMO里见到了永续性,但它们和“逼真”依然有距离。自运转,是始终缺失、却至关重要的部分。我们可以借用两部电影的设定,来感受这种缺失所带来的问题——“玩家光环”和“剧本重复”。 《楚门的世界》里围绕楚门的车辆 《西部世界》里早晨醒来的Dolores 相比之下,在一个自运转的虚拟世界里,玩家只是众多角色中平平无奇的一个nobody。不仅玩家会对环境产生影响,环境也会对角色(包括玩家和其他)产生影响,角色会自我成长,环境会自我演化。后三者都是“自运转”所独特具有的,也是带来真实感和自由度的重要方面。我们能在同一个虚拟世界中,看到《Minecraft》里玩家对环境不遗余力的改造,看到《塞尔达传说》里下雨对岩石、雷电、火、动植物生态的影响,看到《中土世界:暗影魔多》里能记住与玩家交互历史的半兽人队长,看到《星际拓荒》里沧海桑田、斗转星移的太阳系。整个世界不再围绕着玩家、不再受限于剧本,更像是一个星系里无数个相互作用的星球,有自转,也有公转。当然,以上只是基于理想主义的一厢情愿。回归到实现的可行性上,大规模和永续性首先对美术侧的物体/环境表现、海量资源渲染,以及程序侧的服务器端性能、海量日志存储都提出了很高要求,自运转更是需要相当复杂的AI逻辑来支撑。虽然相比于状态机和行为树,近年来风生水起的目标导向型(GOAP,Goal-Oriented Action Planning)AI和系统驱动型(Systemic)游戏设计已经往前又迈出了一大步。但剩下的路,也许只有仰赖深度学习的力量。 从Atari到即时战略游戏,从躲猫猫到黑暗森林版的MMO,深度学习AI学会了解决越来越复杂的问题。有朝一日,如果我们能程序化地构建一个大规模、永续性的游戏环境,让成千上万由AI驱动的角色在里面自己采集、建造、生存、繁衍,通过模拟角色成长、环境变迁,以及环境与角色之间千丝万缕的相互作用来实现自运转,也许我们真的能构建出一个理想中的、逼真的虚拟世界。在2020年的今天,当虚幻引擎5的演示视频在朋友圈刷屏,当学术会议和毕业典礼移步到《动森》和《Minecraft》里举行,当马斯克“人类活在真实世界的概率只有十亿分之一”的论断言犹在耳,我们所处的这个世界不可避免地开始在现实与虚拟之间摇摆徘徊。这也赋予了“构建虚拟世界”这个命题更大的现实意义——也许我们不仅是在研究“那个世界”,更是在研究“这个世界”、研究我们自己。
从随机性内容看游戏中的AI应用 我们在《游戏+AI:我们的征途是星辰大海》一文中曾提出: “学术界把游戏AI的研究意义上升到了对AGI(通用人工智能)的探索。基于游戏中可控的环境、充足的训练数据,AI可以在虚拟世界里试验感知、决策、合作等多项能力,甚至与物理世界形成打通;另一方面,前沿研究也牵引着游戏AI在工业界探索更广泛的运用,在游戏的设计、生产、分发、运营等多个环节提供价值,比如内容生成、玩家模拟、玩家建模等,目的则都是围绕着如何提升玩家在游戏中的体验。”事实上,如果把“AI”狭义地定义为“基于机器学习”而非“基于规则脚本”的AI,我们不难发现:虽然学术界的AI,如玩星际的AlphaStar、玩Dota的OpenAI Five、玩王者的“绝悟”、玩德扑的Pluribus等等,层出不穷;但在工业界,AI始终处于一个辅助的角色。无论是地图/资源生成、冷启动陪玩、动态难度调整甚至反外挂,都还是更偏幕后,与游戏本身的成败之间不是最直接的关系。OpenAI Five战胜Dota2世界冠军OG 怎样才能让AI走到幕前,成为一款游戏成功的核心要素呢?显然,需要找到一个可以让AI发挥巨大价值的地方。我们认为,游戏中的随机性内容可能是一个落点。 在考虑AI是否能真正帮助到某款游戏中的随机性内容时,有以下2个问题需要回答:1) 是否重要:随机性内容是否对游戏的核心体验有巨大作用?2) 是否有用:基于AI的随机性内容能否比基于规则脚本的更有竞争力? 基于上述2个问题,就可以把游戏中“随机性内容的AI化”分为3类:不重要;重要但不够有用;重要且有用。我们逐一展开。第一类游戏 这类游戏中,随机性内容对核心体验帮助不大。典型的品类包括Racing(竞速类)、FTG(格斗类)、ACT(动作类)、FPS(第一人称射击类)、RPG(角色扮演类)。 Racing、FTG游戏中的随机性内容主要体现在敌人AI的行为,而核心体验主要关注「操作手感」和「战斗深度」。我们不妨把游戏过程类比为拳击训练,操作手感来自于对基本格斗技巧的驾驭能力,而战斗深度则取决于拳击教练(对手)的水平上限。敌人AI通过动态难度变化,虽然能在一定程度上解决“找不到合适的对手”的问题(也即战斗深度),但对操作手感是毫无帮助的。因此,不能算是对核心体验有巨大作用。Racing游戏的核心体验在于操作手感 而其余的几类游戏,随机性内容对核心体验的价值就更小了:同样以敌人AI作为随机性内容的ACT和FPS游戏,其核心体验几乎完全倒向了「操作手感」;RPG游戏中的随机性内容体现在道具随机掉落(增加探索深度)和随机遇怪(防止玩家疲劳),而核心体验主要是「玩家在游戏中的角色投影」。可以看到,这些随机性内容都无法服务于核心体验。 第二类游戏 这类游戏中,随机性内容影响核心体验,但AI无法有效提升其竞争力。换句话说,传统的规则脚本就能实现得八九不离十了。这里的典型品类包括SLG(策略类)和Survive(生存类)。SLG游戏以《文明》、《三国志》、《全战》为代表,其中的随机性内容主要有以下几类:资源的随机分配能够让玩家能够不断获得新鲜的体验;突如其来的随机事件能够对玩家的既定计划提出挑战、让玩家保持专注;富有挑战的对手AI能够给玩家带来持续的刺激和不断提升自我的动力。这些内容对于玩家「渴望运筹帷幄,提升策略深度&自由度」的核心体验来说,都是很重要的。但问题是,基于机器学习的AI(相比规则脚本)所带来的随机性内容具有很强的不可控性,对于追求掌控感的SLG玩家来说,可能反而是不好的体验。《全战三国》中,规则随机生成的剧情已经出现了吕布被平民打成重伤、刘备鞭打士卒这些让人哭笑不得的戏码,如果进一步用机器学习来做,可能就从SLG游戏变成TVB了。《全战三国》中出现的随机事件 Survive游戏以《饥荒》、《全境封锁》、《美国末日》为代表,其中的随机性内容和SLG类似,但作用不完全相同:资源的随机分配带来了策略差异,避免玩家掌握固定套路;NPC AI一方面能提升游戏的真实感和沉浸感,另一方面也有机会通过个性化,让不同实力的玩家获得成就感。考虑到此类游戏的核心体验是「在有限资源的环境中生存所带来的紧张刺激感」,如何控制好玩家积累资源的速度——前期不至于快速饿死、后期不至于屯粮太多——是一个值得费心的问题。通常情况下,设计师会依赖固定规则或随机算法对玩家可使用的资源进行控制,从而塑造合适的压力积累/释放节奏。比如《饥荒》中的季节变换(冬季资源产出下降/消耗上升)和科技树消耗(前期非必要/后期消耗大量资源),比如《矮人村庄》中根据玩家资源储量的动态入侵设计等等。由于这些随机性内容想实现的目的都相对明确,规则脚本就能基本实现,基于机器学习的AI很难表现出技高一筹。《饥荒》中冬季来临时资源变得匮乏 第三类游戏 这类游戏中,AI终于能大展拳脚,体现出其独特的价值了。典型的品类包括AVG(冒险类)和SIM(模拟类)。AVG游戏比如《塞尔达》、《神海》、《恶魔城》等,其中的随机性内容主要是道具、事件、NPC等可供探索的内容,服务于玩家「渴望探索无边世界」的体验诉求。乍看之下机器学习AI能带来的直接帮助并不大,但丰富的可探索内容显著拉高了制作门槛,导致AVG类游戏一度成为“大厂专属”。直到近年来Roguelike模式的兴起,中小开发团队利用随机地图/关卡生成,另辟蹊径地解决了内容生产力的问题,才使得市面上AVG类游戏得以百花齐放。比如《巫师传说》通过提炼设计规则,让AI自动完成整个关卡的搭建。只要玩家愿意玩下去,就有无穷尽的关卡可供探索。当然,这些关卡肯定不如人工设计的关卡精妙,随机性的存在也会导致不同玩家的游戏体验不可控,AI在这里还有很大的发挥空间——也许把地图生成算法放在服务器端、对每个玩家的行为数据进行学习,AI也能化身成为一名资深关卡设计师。《巫师传说》中的Roguelike地图 SIM游戏比如《荒野大镖客》、《GTA》、《模拟人生》等,其中的随机性内容主要体现在环境(天气/交通/可交互物等)、事件和NPC AI。这些随机性内容在AI的加持下,能够形成更丰富/更真实的交互体验,满足玩家「在虚拟世界中体验第二人生、释放天性」的诉求。比如在《大镖客》里,玩家与NPC之间有着丰富的交互选项——问候、买卖、惹恼、掏枪、抢劫、启动任务、逼问秘密等等,根据交互对象而改变。同时,玩家可以完全按照自己的心情办事,打牌打到一半不爽了怎么办?直接站起来挨个点名。《荒野大镖客》中自由的交互方式 相比第二类游戏,我们不难发现,第三类游戏主打开放、自由等关键词,其中的随机性内容也因此更为宽泛,并非指向某一明确目的。这也导致如果仍要使用规则脚本来制作内容的话,会耗费大量的资源。《GTA》、《大镖客》的开发时间都在5年以上、开发成本也达到了上亿美元;《最后生还者》中惊艳的同伴AI艾丽,单这一个角色的上线前优化就花了半年时间。规则脚本带来的高额成本,直接导致游戏中的地图大小、NPC数量、交互复杂度等等维度都受到限制。这些「效率低谷」都有机会成为AI的用武之地。 总结 从上面的分析可以看出,AVG中的“探索”元素和SIM中的“模拟”元素,由于其较强的开放性和自由度,可能是更适合AI发挥的场地。以最近大热的开放沙盒游戏《Kenshi》为例,在这款融合了《骑马与砍杀》、《模拟人生》、《辐射》、《神界:原罪》等多种元素的游戏中,玩家可以真正地为所欲为。从采矿种田到圈地建城、从偷**狗到下海经商、从单打独斗到称霸一方,所有能想到的玩法几乎都能在这款游戏中实现。主播“王老菊”的《Kenshi》 游戏截图 即使加载缓慢、画面粗糙、Bug频现,即使大部分NPC都傻得可爱,《Kenshi》中的开放世界还是给了玩家耳目一新的感觉。试想一下,如果通过AI的加持,能够以相对较小的开发成本,让游戏中的随机性内容更加丰富、海量NPC的行为更加智能,这类游戏的可玩性一定会更上一个台阶,甚至可能让玩家把单机游戏玩出MMORPG的感觉。到了那个时候,可能会有一个新的游戏品类诞生,我们姑且称它为——AIG。
从“智障”到“智能”——浅谈游戏中的AI实现 这是超参数科技的第7篇文章。本文回顾了游戏中AI的发展历程,从最早的脚本AI,到后来的有限状态机、行为树,再到时下流行的基于机器学习的AI,且看它是如何从“智障”一步步走向“智能”的。 今天的电子游戏行业,蓬勃发展,日新月异。随着渲染画面越来越逼真、物理反馈越来越真实、传输速度越来越快,加上多人同屏、无线通讯、AR/VR这些新技术的加入,今天的游戏玩家们可以更好地沉浸在设计师们构建的虚拟大千世界里。然而,有一项古老的技术却仿佛受到了冷落,那就是游戏中的AI能力。 AI能力本来是游戏中的核心逻辑,它提供了最直接的玩家体验。其中的代表就是NPC(Non-Player Character,非玩家角色)。玩家和NPC的关系,就像奥特曼和怪兽一样,「Boss虐我千百遍,我却待他如初恋」。然而,在如今越来越高级的渲染、音效甚至交互方式面前,我们看到这些AI仍旧宛若“智障”一般,难以带来惊喜。 传统脚本AI 回顾电子游戏的发展史,不难发现,游戏中的AI能力是伴随着电子游戏一起诞生的。早在1950年,电子计算器还是微型真空管的时代,就已经有工程师们在创造游戏了。其中有一款游戏名为《伯蒂的大脑》(Bertie the Brain)[1],玩家可以在四米高的计算机上,通过九宫布局的背光键盘走子,与电脑对弈井字棋,同时大屏幕上会显示当前的棋局。《伯蒂的大脑》游戏 当时这个巨大的电子设备上有一个亮着灯光的记分板,上面写着:“电脑大脑”vs“人类大脑”。似乎已经预示了,在电子游戏的发展道路上,游戏AI注定会作为一个重要的组成部分,为玩家提供对抗、合作、观察等丰富的游戏体验。 而AI能力真正被玩家广为熟知,是通过早期Atari 2600平台上的一些游戏,其中最典型的就是《吃豆人》(Pac-Man)。《吃豆人》游戏 这是一款令无数玩家着迷和抓狂的游戏。其中的四个“小鬼”是通过AI来设计的,会不断跑动来抓“吃豆人”。玩家需要在一次又一次紧张刺激的路口抉择中,完成吃豆和躲避“小鬼”。新手玩家甚至会有被“小鬼”们戏弄的感觉。 实际上,当时的AI并没有那么智能。“小鬼”的“思考”方式非常简单: 红色:一直跟在玩家后面。 粉色:以玩家行进路线的下一个路口为目标。 蓝色:以下一个路口后的路口为目标。 黄色:完全随机行动。小鬼们的“思考”方式 而就是这些简单的逻辑,组合起来后就仿佛具有了思考能力。让无数的玩家在一次又一次的被抓后,毅然开启新一盘的挑战。不过,虽然怪物的行为有多种规则,目的还是太过单一。在“吃豆人”这种简单目标的游戏中还好,到了目标更多、更复杂的游戏中(比如策略类游戏),那么仅按照单个预定目标一直走下去,显然还是过于“蠢”了。[2]。 于是,以有限状态机、行为树为核心的游戏AI模式出现了。 有限状态机 有限状态机,简称FSM(Finite-state machine),是一种基于单个或多个状态的假设机器。有且只有单个状态可以处于活动状态,因此机器必须从一种状态转换到另一种状态,以便执行不同的操作。 如下图所示,基于有限状态机的AI怪物,可以体现出比较复杂的行为,包括原地巡逻、发现玩家后攻击玩家/躲避攻击,甚至在自身血量少的情况下,还会主动逃跑、寻求支援。有限状态机 此时的游戏AI,会更接近对真实世界生物行为的模拟,产生更丰富的行为。但状态机的弱点也很明显,玩家熟悉后会逐渐总结出设计者的逻辑,并形成针对性的策略。好的一面是游戏AI本身产生了不少有趣的套路玩法,而坏的一面则是一些bug会让玩家找到漏洞,研究出反制策略让设计者的意图落空。 比如时下很火的动作游戏《只狼:影逝二度》,玩家就学会了利用NPC Boss的一个逻辑bug,在特定的地形位置,100%无伤地慢慢消耗boss血量,以“作弊”的方式击杀Boss。玩家把这种操作戏称为给Boss“修脚”。《只狼》中的修脚师玩家 行为树AI 现代游戏AI的主流方法是行为树AI。它有着比状态机更为复杂的结构和设计,但本质上也是通过把人类的决策思路通过具体的逻辑判断,一层一层展开来实现的。 行为树的设计是通过一个树状结构,每次更新时都会从树的根节点出发,根据子节点的类型和状态,来确认要操作的状态切换以及实际动作。它比状态机复杂的地方在于,每一个节点都有执行的状态,以及,每次执行完成后都会向父节点传递执行结果。再配合各种内部的特殊节点,就可以实现有一定复杂行为的游戏AI。 其中比较重要的特殊节点包括: Selector Node 选择节点:按顺序选择第一个执行条件为真的子节点,遇到True停止。 Sequence Node 序列节点:按顺序执行每一个子节点,遇到False停止。 Parallel Node 并行节点:从头到尾,平行执行它的所有子节点。 通过合理的设计,可以快速实现一个复杂AI,比如:让Boss通过选择节点攻击离它最近的玩家的同时,通过并行节点关注自身血量,并且通过序列节点使用各种技能给自己回血。上述行为的编写只需要几个简单的特殊节点,即可串起整个逻辑。 如下图所示,通过直接编写AI的判断逻辑,制作对应的动作,即可实现一定程度的“智能”。基于可视化的工具,可以很好地看到行为树的执行状态。可视化的行为树 行为树对游戏设计者来说,已经是一个相对靠谱的解决方案。但随着游戏越来越复杂,行为树的节点数量会出现爆炸增长,维护难度也随之大大提升。行为树节点爆炸 但即使在这么细致复杂的结构下,一些关键问题也始终未能得到解决: 1) 未知输入条件适应 基于人类想实现的效果、以人类思考逻辑来编写,始终无法确保不会存在设计者意料之外的分支。在那些分支下,由于输入条件是未知的,再精雕细琢的AI也会显得特别“**”。随便举个例子,打过《魔兽争霸3》的读者可能知道,早期人族打AI时有一个耍赖战术:箭塔流。第一个开发出这个战术的玩家看来是吃透了电脑的智力水平,直接一路把防御塔修到对面家门口,电脑就算看到有个农民在这造塔也会假装没看到,继续安心工作。跟这样的电脑对手打,中等水平的玩家都会很快丧失兴趣,更别提那些指望提升技术的高手玩家了[3]。《魔兽争霸3》玩家“箭塔流”取胜 2) 固定的临界值判断 AI在编写判断逻辑时,一般都会有一个临界值。比如怪物在追击了玩家一定距离后,自动会返回巢穴。而聪明的玩家,会在此时立刻转身开始反追怪物,导致怪物傻傻挨打。这种行为还有了一个专门的名称:“拉怪”。以至于现在的游戏不得不在怪物返回巢穴的时候,增加回血机制或者直接变成无敌状态。可见这种单一的条件维度和临界数值,很容易被玩家感知并加以利用。玩家“拉怪”操作 3) 随机性和成长性缺失 行为树规则下,每次执行的行为通常也是固定的,既缺少由随机性能带来的分支广度,也缺少经过时间累积、根据玩家个性化操作产生的分支深度。对玩家来说,见过第一次之后就不会再有任何惊喜感。电影《勇敢者的游戏:决战丛林》里有个桥段就是调侃游戏里NPC的对话内容一成不变。《勇敢者的游戏:决战丛林》剧照 总结 回顾游戏AI的发展历程,可以发现今天的游戏AI还有非常大的提升空间。随着深度学习、人工神经网络的兴起,游戏AI(甚至游戏里其他方方面面)的问题,都可能迎来全新的解决思路。包括前文提到的对未知输入条件的适应、单一的临界条件值、以及随机性/成长性问题等,都是深度学习所擅长的领域。 而结合大数据、统计学习的能力,可以让深度学习在游戏关卡设计、数值平衡、NPC对话内容生成、美术模型/贴图、动作资源产生等方面带来进一步的效率优化。 我们有理由相信,在不久的将来,AI赋能下的游戏将会变得更加丰富多变、更加贴近真实世界,甚至开创出全新的游戏品类。
Intel Tiger Lake AI引擎引入Xe GPU架构:PC越发聪明 Intel十代酷睿移动版现有10nm Ice Lake-U/Y、14nm Comet Lake-U/Y系列,均主要面向轻薄本,马上就会有14nm Comet Lake-H,自然主打游戏本。Ice Lake的继任者将是Tiger Lake,这是早就官方宣布的,预计会使用进一步强化的10nm++工艺,集成全新的Willow Cove CPU架构、Xe GPU架构(12代),整体性能、功能都会有巨大的飞跃。本届CES大展上,Intel将会公布Tiger Lake的更多细节,最核心的就是AI能力。Ice Lake是第一个将AI大规模应用于PC的平台,Tiger Lake则会在其基础上进一步深入,借助DL Boost机器学习加速、Xe图形架构、低功耗加速器(Low Power Accelerators)组成全新的AI引擎。Intel Tiger Lake加入全新AI引擎!PC越来越聪明AI在智能手机上已经几乎无处不在,PC上的应用也越来越广泛,涉及图像、音频、视频、语音等各个领域,很多时候大家可能并没有感觉到,但是AI就在幕后默默地做着贡献。Intel Tiger Lake加入全新AI引擎!PC越来越聪明对于不同的AI应用,Intel处理器可以通过不同的模块进行加速,CPU、GPU、GNA(高斯网络加速器)等各司其事,带来效率的最大化。Intel Tiger Lake加入全新AI引擎!PC越来越聪明比如使用酷睿i7-1065G7给一张2000×1616分辨率的黑白老照片上色,只需要大约4秒钟,而没有AI引擎的竞品要慢一倍。而在部分AI应用中,Ice Lake的性能甚至可以是竞品的多达5.7倍!Intel Tiger Lake加入全新AI引擎!PC越来越聪明Intel Tiger Lake加入全新AI引擎!PC越来越聪明Intel Tiger Lake加入全新AI引擎!PC越来越聪明从Intel目前的技术规划、产品设计来看,已经不再过于注重单纯的CPU、GPU性能,而是在制程封装、架构、内存存储、互连、安全、软件这里六大支柱的战略支撑下,更注重系统级应用性能的整合、各项新技术的融合。AI无疑就是其中的重中之重,再加上5G、Wi-Fi、雷电等多种连接性技术的辅佐,从多个不同维度来提升用户的实际应用体验,让传统PC变得更加智能,更加聪明,适应和满足现代乃至未来新型工作负载的需求,也可以看出Intel巩固其PC领域霸主地位的持续努力。
涌现、进化和通用人工智能 AI研究的理想之一是打造一个在广度和适应性上都能媲美人类的系统,这种系统通常被称为通用人工智能(AGI,Artificial General Intelligence)。 在“如何使AGI具备智能”这个问题上,如果对标“生命是如何诞生的”,至少有两个可能的方向:设计思路和进化思路。前者认为宇宙中生命的出现就像荒野上出现了一块精密的钟表,一定是由上帝这个“钟表匠”设计出来的;后者则认为生命来源于自然选择,这位钟表匠是盲眼的,他遵循非常简单的规则造就出了复杂生命。 相应的,设计思路希望通过硬编码实现AGI;进化思路则试图构建一个复杂环境,让AGI自然涌现于这个系统中。可想而知,前者的实现难度极高,于是人们转向后者,并采取了一些尝试。 John Conway的生命游戏 生命游戏是计算机涌现式设计中最著名的例子,1970年由剑桥大学的John Conway编制。在这个程序里,生命在一个二维方格世界上运转,每个方格作为一个生命体,具备生存、死亡两种状态。任一方格周围的8个方格称为它的邻居。方格的状态会随时间变化,变化仅依赖于其自身及邻居的状态。 这些变化遵循4条非常简单的规则 - 1)存活细胞周围邻居数<2时,该细胞死亡。 2)存活细胞周围邻居数=2时,该细胞存活。 3)存活细胞周围邻居数>2时,该细胞死亡。 4)死亡细胞周围邻居数=3时,该细胞获得生命。 基于这些简单规则和随机初始值,大量个体通过互相作用,在系统层面上涌现出了复杂的行为。 从简单的这些:到复杂的这些:甚至这些:很难想象,这些如同工厂车间、作战编队甚至物种文明的行为,竟然无需依靠硬编码,而是自发产生的。当然,这些行为是否可以被算作真正的智能还有待讨论,毕竟智能体在整个过程中并无法做出选择,演化结果在初始状态时就已完全确定。如果在其中加入更多随机性,能否产生更强的智能呢? Tom Ray的人工生命Tierra 凯文·凯利在《失控》一书中介绍过一个有趣的研究,发生在更早的90年代初,来自生态学家Tom Ray。实验过程是这样的:划出一块特定的内存空间(称之为“伊甸园”),在其中设置一段80字节的代码(称之为“亚当”),亚当会在伊甸园里自我复制、抢占内存。同时他还引入了变异机制和死亡机制,前者使程序复制时有一定概率发生转码错误,后者会清除太老或无效的程序。设定完这些后,Tom启动了程序。图一:伊甸园,程序复制占据内存。具备变异(闪电)和死亡(骷髅)。 图二:宿主,有3个基因组(绿方块),通过CPU(绿球)复制自己。 图三:寄生虫,有2个基因组(蓝方块),通过CPU(蓝球)基于邻近宿主基因组复制自己。 图四:超寄生虫,有3个基因组(红方块),从寄生虫窃取CPU(蓝球),连同自身CPU(红球)执行复制,可同时生成2个复制体。 一觉醒来,Tom发现这个伊甸园里经历了史诗般的进化历程。最开始时,亚当80不断自我复制,直到占满内存。接着,变异产生了全新的45,这个45是个寄生程序,通过吃掉80来繁殖自己。就在80即将灭绝的时候,80发生了一次变异成为了79,79对45是免疫的,45因为找不到宿主而逐渐饿死了。这之后,又陆续出现了反制79的全新寄生程序51,以及寄生在51身上的超寄生程序22等等,最新一统伊甸园的正是这个22。红色:宿主程序80;黄色:寄生程序45;蓝色:带免疫宿主程序79 图一:宿主统治内存,寄生虫开始浮现。 图二:寄生虫统治内存,宿主消减,免疫宿主开始浮现。 图三:免疫宿主把寄生虫挤到内存上方区域。 图四:免疫宿主统治内存,原宿主和寄生虫面临灭绝。 有趣的是,这个22字节的代码非常简洁。Tom原本猜想进化或许能把80字节降到75字节左右。他发给一位麻省理工的程序员看,对方表示自己的最好成绩也需要31字节。可见,无目的的随机进化竟然超越了人类精雕细琢的手工编码。这也不禁让人好奇,如果在随机性之上再让智能体有更多选项可以自主选择,能否产生更强的智能呢? OpenAI的Neural MMO 今年初,OpenAI发布了一款名为Neural MMO的大型多智能体游戏环境,可以说是到目前为止对文明进化的最好模拟。这个游戏中没有人类玩家,全部是AI智能体。智能体需要在游戏中探索地图、争夺资源、消灭竞争者,最大化自身的存活时间。游戏开始时,AI会出生在地图边缘,自带32点食物、32点水和10点生命。每回合消耗1点食物和1点水,当食物或水降为0后每回合扣1点血,血条为0时死亡。 环境中有6种地形: 石头:不可通行; 岩浆:会杀死AI; 水域:不可通行,在附近时获得5点水。水资源无限; 草地:可通行; 森林:可通行,经过时获得5点食物。之后变为灌木丛; 灌木丛:可通行。每回合有2.5%几率变为森林。 由于竞争的引入,游戏中加入了3种攻击方式: 近战:给1格内敌人造成10点伤害; 远攻:给2格内敌人造成2点伤害; 魔法:给3格内敌人造成1点伤害,并冻在原地2回合。 每造成1点伤害,AI可以从对方身上获得1点食物和1点水。刚出生的AI有15回合的新手保护。 不难发现,从这些设定来看,游戏本身已经很接近真实文明的发展环境,智能体也表现出了更丰富的行为。比如学会了猥琐发育,即使不得已要打架也尽量避免肉搏(以免被秒);比如经过更大群体训练的智能体更愿意探索、也更有技巧,说明了“残酷竞争可以更好地激发出智能潜力”;比如不同种群(同一种群共享参数权重)的智能体倾向于占据不同地理位置,有的隐居山林、有的沿江发育,十分接近真实的文明发展历程。 从完全依赖初始值、无随机、无选择的生命游戏,到加入一定随机性的人工生命Tierra,再到赋予AI选择权利的Neural MMO,我们看到在更复杂更多变的环境下,AI也涌现出了更强的智能。 而随着AI技术的进一步发展,模拟环境可能还会做到更逼真,包括但不限于: 1)加入繁衍:允许智能体传宗接代、遗传、变异等。 2)加入语言:允许智能体间通信,带来博弈可能。 3)更丰富的行为:加入建造、种植、装备等行为。 总结 如果把现有的AI能力想象成一个球体,这个球体上有些柱子很长:比如记忆/存储、逻辑运算、翻译、视觉/语音感知等,有些柱子还很短:比如文学、社交、艺术、创造等。现有的AI研究路径更接近设计思路,即希望通过逐个提升不同柱子的长度,拼凑并扩大整个球体的体积。但球体表面始终是坑坑洼洼的,意味着AI能力始终是在某些任务上表现好、某些任务上不行。 而如果选择进化思路,理想的情况可能会是这样:这个球体初期非常小,但随着不断的训练和学习,会逐渐变大。球体上没有柱子的概念,永远是一个完整的球体。AI会更接近一个生命的成长过程,虽然能力仍然是逐渐从弱到强,但始终是全面的、通用的、灵活的。 这可能会让我们距离AGI这个终极目标,更近一步。
渡鸦科技创始人再创业,「rct studio」用AI引擎做沉浸式全互动娱 2018年12月,互动电影《黑镜:潘达斯奈基》(Black Mirror: Bandersnatch)在Netflix上线,允许玩家代替主角在不同事件中做出选择,选择不同的故事线。 新奇的交互模式引起了观众的很大兴趣,猛增的用户流量甚至一度让Netflix服务器宕机。2019年以来,谷歌、亚马逊、BBC纷纷宣布制作并推出自己的互动作品,在国内,爱奇艺、腾讯、B站等互联网巨头也开始布局互动剧。 rct studio是36氪最近接触到的一家新型创意娱乐工作室,成立于2018年,致力于通过人工智能研发下一代沉浸式交互娱乐体验,公司曾入选美国最大创业孵化器 Y combinator, 同时是YC China第一批学员。 从交互的角度看,rct studio创始人吕骋认为,拿着遥控器在仅有的几个选项中选择剧情,并不是互动电影的最终的形态,这对观众体验而言,是割裂的。 在rct studio的设想中,用户需要完全沉浸在故事环境中,自然语言和动作成为影视画面的连接点,参与者可以自由进行决策,每一次动作都能被即时绘制成相应的3D视图,推动故事发展。这从形式上来说,无法具体被定义为电影或者游戏,rct studio将其统称为沉浸式全互动娱乐。 那么,如何做到? rct studio自主研发的一款基于AI的Morpheus引擎,核心能力有机器学习能力(Machine Learning),自然语言程序(NLP)、文字实时转3D图像程序(Text-to-3D render)和基于深度神经网络计算的动作预测生成 (Motion prediction generation system)。 通过对大量剧本的学习,Morpheus可以将所输入的单一故事剧情拓展成一个开放世界,从文字中理解情节、人物之间的内在逻辑和关系,根据这些,丰富每个角色的思维、行动方式。相当于为每个人物后都是有一个独特的AI模型,这些算法都会在这个故事线里面理解出自己应该做什么,然后他们会在角色和角色之间交叉验证,最终可视化出来的所有可能的结局。 这样可以提供的价值是,在观众参与进剧情之后,所作出的每一个选择,只要是符合故事环境逻辑的,其他NPC都会据此开始作出反应。也就是说,AI可以自动完成故事线的构造,这解决了人工编剧在互动剧前期大量的故事分支工作。故事分支 通过输入文字,文字实时转3D图像程序可实时快速生成人和物体的物理表现及运动关系。以实时推流的方式,算法在人物运动的每一帧会预判并推出下一帧的预渲染结果,达到一个可以实时动态的过程,不需要在本地进行操作,也不需要在电脑端做额外的渲染。 以走路为例,利用动作预测生成可以任意规划路径,在它走路的过程中也可以任意调整,假设在路径中突然放置一个石头,人会直接在动态的过程中避障,然后重新规划路径。左侧可自动避障 这是一种新的数字内容生产方式,吕骋称,可以将制作周期大幅缩减。还是以走路为例,在传统的制作流程中,需要先做三维建模、骨骼绑定、以及动态调整。利用这个程序,原本可能需要8-9月完成的工作,只需要3-4天就可以完成。 并且,这个程序可以支持多物体间的运动关系,考虑到物理层面的意义。譬如,杯子扔在沙发上和扔在桌子上,后者会碎,前者不会。在互动娱乐环境中,这可以为即时人物的反馈提供物理支撑。 总体来说,运用Morpheus引擎,制作一部互动娱乐产品的流程,只需要输入一个好莱坞标准剧本,或描述一个足够清晰的场景,机器就可以自动拓展故事节点、完善人物决策模型、生成场景物理表现和人与物的运动关系。 用户戴着带麦克风的VR眼镜以及体感设备,扮演自己的角色,就可以开始与剧中人物进行语音对话交互,和动作交互了。 吕骋称,rct studio核心希望解决的是如何将文字快速生成有内部逻辑的开放世界以及如何变成实时的动作,不论是Morpheus还是其他的技术手段,都只是为了最终提升虚拟数字内容生产效率的工具,rct studio希望做到的做虚拟数字世界的“水电网”。 与南京大学人工智能创新研究院合作,将推出用户级体验产品 根据rct studio联合创始人马欣洁的介绍,rct studio目前已与南京大学人工智能创新研究院达成战略合作,双方将围绕强化学习(Reinforcement Learning, RL)进行课题合作,研究成果将帮助rct studio优化人物决策模型。 2020年,rct studio会推出一款用户级别的娱乐体验产品,以银行抢劫案作为情景主题,主要面向海外市场。在内容上, 吕骋表示,rct studio会偏好选择先与成熟IP进行合作,目前与科幻内容发行商未来事务管理局已经达成合作,后者曾签约的作家人数约达200人,包括《三体》作者刘慈欣,之后两者或将合作推出交互式电影。 商业模式上,吕骋称,比起面向B端直接提供工具,rct studio对C端市场更加感兴趣。除了整体产品售卖, 在体验的过程中的增值服务也在想象空间内。 目前rct studio团队十余人,总部位于美国洛杉矶,创始人吕骋毕业于英国利物浦大学,曾创办人工智能智能操作系统渡鸦科技,被百度收购后曾出任百度智能家居硬件总经理,向百度集团总裁和首席运营官陆奇汇报。rct studio曾获星瀚资本和 Y Combinator的数百万美元种子轮融资,以及Makers Fund 千万美元的 A 轮投资。 文中图片来源:rct studio
首页 1 2 3 4 5 6 下一页