• 首页 首页 icon
  • 工具库 工具库 icon
    • IP查询 IP查询 icon
  • 内容库 内容库 icon
    • 快讯库 快讯库 icon
    • 精品库 精品库 icon
    • 知识库 知识库 icon
  • 更多 更多 icon
    • 服务条款 服务条款 icon

谷歌通过开源框架改进AI模型训练

武飞扬头像
xhjyxxw
帮助0

知行礼动

大家好,今日小科来聊聊一篇关于谷歌通过开源框架改进AI模型训练的文章,现在让我们往下看看吧!

到目前为止,强化学习已经被用于一些最令人印象深刻的AI演示中,包括那些在Alpha Go和Dota 2中击败人类专业游戏玩家的演示。谷歌的子公司DeepMind将其用于Deep Q网络(DQN)。

建立强化学习框架需要时间和重要资源。为了让AI充分发挥它的潜力,它需要变得更容易接近。

从今天开始,谷歌正在开发一个基于TensorFlow的开源增强框架——它的机器学习库——可以在GitHub上获得。

谷歌大脑研究人员巴勃罗塞缪尔卡斯特罗和马克贝勒马尔在一篇博客文章中写道:

“灵感来自大脑激励行为的主要组成部分之一,这反映了神经科学和强化学习研究之间的强大历史联系。该平台旨在实现那种可以促进激进发现的思辨研究。

这个版本还包括一组说明如何使用我们的框架的协作。"

谷歌的框架设计有三个关键点:灵活性、稳定性和可重复性。

该公司为街机学习环境提供了15个代码示例——一个使用视频游戏评估人工智能技术性能的平台——以及四种不同的机器学习模型:C51、上面提到的DQN、隐式索引网络和彩虹代理。

强化学习是最有效的训练方法之一。如果你正在训练一只狗,提供治疗作为对所需行为的奖励是实践中积极强化的一个关键例子。

训练机也是类似的概念,只提供奖励或者保持零零,而不是好吃的商品或者工资。

Bellemare和Castro写道:“我们希望我们框架的灵活性和易用性将使研究人员能够尝试新的想法,无论是渐进的还是激进的。“我们积极将其应用到研究中,发现它使我们能够灵活、快速地迭代许多想法。”

“我们非常高兴看到一个更大的社区能够做到这一点。”

这篇好文章是转载于:知行礼动

  • 版权申明: 本站部分内容来自互联网,仅供学习及演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,请提供相关证据及您的身份证明,我们将在收到邮件后48小时内删除。
  • 本站站名: 知行礼动
  • 本文地址: /news/detail/tanhbihkgb