• 首页 首页 icon
  • 工具库 工具库 icon
    • IP查询 IP查询 icon
  • 内容库 内容库 icon
    • 快讯库 快讯库 icon
    • 精品库 精品库 icon
    • 知识库 知识库 icon
  • 更多 更多 icon
    • 服务条款 服务条款 icon

科技前沿信息微软的挑战要求AI代理商在虚拟世界进行合作

武飞扬头像
xhjyxxw
帮助0

知行礼动

大家好,今日小经来聊聊一篇关于科技前沿信息:微软的挑战要求AI代理商在虚拟世界中进行合作的文章,现在让我们往下看看吧!

如果人工智能(AI)代理人要成为社会中真正的玩家,利用他们的机器能力来补充我们的人类优势,他们必须首先成为Minecraft视频游戏的玩家。为了在Minecraft中证明自己,他们必须共同努力捕捉迷宫中的动物,建筑积木塔,并在反抗骷髅的同时追寻宝藏。

无论如何,这是由微软,伦敦玛丽女王大学和crowdAI(数据科学挑战平台)组织的竞赛的前提。下个月,组织者将宣布获胜者 - 创建AI的团队,该团队可以最好地观察其Minecraft环境,确定其必须完成的三个任务中的哪一个,然后与另一个AI代理协作以执行该任务。

通过强调适应性和合作,组织者旨在鼓舞人工智能代理的研究,有朝一日可以与人类互动,完成现实世界中的任务。虽然能够真正匹配人类智力的AI仍然是科幻小说的内容,但研究人员可以采取故意义的步骤,实现Minecraft中人工智能(AGI)的目标。

MalmO(MARLO)竞赛中的Multi-Agent强化学习是2015年由英国剑桥微软研究院的AI研究员Katja Hofmann开始的Malmo项目的一个分支。虽然很多令人兴奋的人工智能研究涉及AI掌握国际象棋和围棋等战略游戏,但霍夫曼正在追寻一种同意 AI学习更广泛技能的游戏。

“我们开始谈论Minecraft时,显然这是人工智能研究的完美环境,”她说。“这是一个人们没有预定目标加入的世界。”Project Malmo是一个建立在Minecraft之上的平台,研究人员可以在其中执行许多不同类型的AI实验,同时也以标准化的方式比较他们的结果。

在首次MARLO挑战中,2017年,AI代理人被要求执行一项任务:抓猪。在2018年的比赛中,组织者通过设计三个需要协作的不同任务变得更加困难。AI竞争对手必须学习如何在环境中识别另一个AI代理,然后找到一种方法来共同实现他们的共同目标。

可以假设另一个代理人的目标的AI代理人将具有心理学家所谓的“心理理论 ”的基本形式,即人类将心理状态和意图归因于其他人的能力。霍夫曼希翼AI代理人最终能够通过与Minecraft中的人类玩家合作来磨练这种能力。“然后算法可以学会与人类合作,”她说,“并学习人类想要的东西。”

在MARLO比赛中发挥作用的AI通过强化学习进行训练,其中AI通过激烈的试验和错误过程学习。每支球队的AI都是通过随机动作和观察他们对比赛的影响开始的。竞赛环境在游戏中内置了奖励,因此AI获得了某些成就的积分。最终,人工智能找出了导致它获得积分的行为 - 这导致了捕获的鸡肉或被发现的宝藏。虽然强化学习算法在这些培训课程中完成了大部分工作,但每个MARLO团队都有自己的策略来加速或改善学习。

Minecraft是人工智能研究人员现在使用的众多复杂视频游戏中的一种,Igor Mordatch 是旧金山非营利性研究机构OpenAI的多元化研究负责人。OpenAI并未专注于Minecraft,而是创建可以玩多人视频游戏Dota2的 AI代理。

“我们正在建立一个良好的环境生态系统和强化学习的基准,”Mordatch说。“但现在面临一个挑战:我们如何确保AI在这些游戏中学到一些实用的东西?”

霍夫曼说,在Minecraft中取得成功的AI代理商也可能在其他视频游戏中取得成功。很容易想象AI可以为游戏中的非玩家角色提供动力,也许这些角色能够自然地进行交互并与人类玩家合作。

MARLO挑战中的一个竞争对手看到了更多实际应用。韩国电子与电信研究所的研究员Donghun Lee 专注于让他的AI代理人进行有效沟通并表达其意图。他说这种能力将直接影响他的物联网研究。李说,智能设备的激增带来了通信问题,因为许多网络设备现在需要协同工作。

“在云中同时操作所有这些设备并非易事,”他说。但他表示,通过多代理强化学习,物联网设备可以找出如何协同工作。

这篇好文章是转载于:知行礼动

  • 版权申明: 本站部分内容来自互联网,仅供学习及演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,请提供相关证据及您的身份证明,我们将在收到邮件后48小时内删除。
  • 本站站名: 知行礼动
  • 本文地址: /news/detail/tanhebffff