科技前沿信息微软的挑战要求AI代理商在虚拟世界进行合作

xhjyxxw

2024-07-16 帮助0人

知行礼动

大家好，今日小经来聊聊一篇关于科技前沿信息：微软的挑战要求AI代理商在虚拟世界中进行合作的文章，现在让我们往下看看吧！

如果人工智能(AI)代理人要成为社会中真正的玩家，利用他们的机器能力来补充我们的人类优势，他们必须首先成为Minecraft视频游戏的玩家。为了在Minecraft中证明自己，他们必须共同努力捕捉迷宫中的动物，建筑积木塔，并在反抗骷髅的同时追寻宝藏。

无论如何，这是由微软，伦敦玛丽女王大学和crowdAI(数据科学挑战平台)组织的竞赛的前提。下个月，组织者将宣布获胜者 - 创建AI的团队，该团队可以最好地观察其Minecraft环境，确定其必须完成的三个任务中的哪一个，然后与另一个AI代理协作以执行该任务。

通过强调适应性和合作，组织者旨在鼓舞人工智能代理的研究，有朝一日可以与人类互动，完成现实世界中的任务。虽然能够真正匹配人类智力的AI仍然是科幻小说的内容，但研究人员可以采取故意义的步骤，实现Minecraft中人工智能(AGI)的目标。

MalmO(MARLO)竞赛中的Multi-Agent强化学习是2015年由英国剑桥微软研究院的AI研究员Katja Hofmann开始的Malmo项目的一个分支。虽然很多令人兴奋的人工智能研究涉及AI掌握国际象棋和围棋等战略游戏，但霍夫曼正在追寻一种同意 AI学习更广泛技能的游戏。

“我们开始谈论Minecraft时，显然这是人工智能研究的完美环境，”她说。“这是一个人们没有预定目标加入的世界。”Project Malmo是一个建立在Minecraft之上的平台，研究人员可以在其中执行许多不同类型的AI实验，同时也以标准化的方式比较他们的结果。

在首次MARLO挑战中，2017年，AI代理人被要求执行一项任务：抓猪。在2018年的比赛中，组织者通过设计三个需要协作的不同任务变得更加困难。AI竞争对手必须学习如何在环境中识别另一个AI代理，然后找到一种方法来共同实现他们的共同目标。

可以假设另一个代理人的目标的AI代理人将具有心理学家所谓的“心理理论 ”的基本形式，即人类将心理状态和意图归因于其他人的能力。霍夫曼希翼AI代理人最终能够通过与Minecraft中的人类玩家合作来磨练这种能力。“然后算法可以学会与人类合作，”她说，“并学习人类想要的东西。”

在MARLO比赛中发挥作用的AI通过强化学习进行训练，其中AI通过激烈的试验和错误过程学习。每支球队的AI都是通过随机动作和观察他们对比赛的影响开始的。竞赛环境在游戏中内置了奖励，因此AI获得了某些成就的积分。最终，人工智能找出了导致它获得积分的行为 - 这导致了捕获的鸡肉或被发现的宝藏。虽然强化学习算法在这些培训课程中完成了大部分工作，但每个MARLO团队都有自己的策略来加速或改善学习。

Minecraft是人工智能研究人员现在使用的众多复杂视频游戏中的一种，Igor Mordatch 是旧金山非营利性研究机构OpenAI的多元化研究负责人。OpenAI并未专注于Minecraft，而是创建可以玩多人视频游戏Dota2的 AI代理。

“我们正在建立一个良好的环境生态系统和强化学习的基准，”Mordatch说。“但现在面临一个挑战：我们如何确保AI在这些游戏中学到一些实用的东西?”

霍夫曼说，在Minecraft中取得成功的AI代理商也可能在其他视频游戏中取得成功。很容易想象AI可以为游戏中的非玩家角色提供动力，也许这些角色能够自然地进行交互并与人类玩家合作。

MARLO挑战中的一个竞争对手看到了更多实际应用。韩国电子与电信研究所的研究员Donghun Lee 专注于让他的AI代理人进行有效沟通并表达其意图。他说这种能力将直接影响他的物联网研究。李说，智能设备的激增带来了通信问题，因为许多网络设备现在需要协同工作。

“在云中同时操作所有这些设备并非易事，”他说。但他表示，通过多代理强化学习，物联网设备可以找出如何协同工作。

这篇好文章是转载于：知行礼动