算法帮助AI在传奇的Atari游戏中获胜
2015年,谷歌的DeepMind AI的任务是学习玩Atari视频游戏。它也非常成功,在视频弹球方面与人类玩家一样出色。但由于游戏的复杂性,除了简单的街机游戏之外,它开始挣扎,众所周知甚至未能收集传奇的20世纪80年代冒险游戏Montezuma"s Revenge中的第一把钥匙。
然而,一种新方法导致了一种AI算法,该算法从错误中学习,并确定中间步骤的速度提高了10倍,在Google失败并成功自主玩Montezuma"s Revenge之后取得了成功。
这项工作由Fabio Zambetta及其团队在澳大利亚墨尔本的RMIT大学进行。Zambetta 于2月1日在夏威夷举行的第33届AAAI人工智能会议上介绍了这一发现。
(相关资料图)
设计可以克服计划问题的人工智能,例如奖励不是很明显,是推动该领域最重要的挑战之一。
人工智能在冒险游戏中挣扎的原因是,在发现一些奖励之前,它认为没有动力选择一种行动方式而不是其他任何一种方式,例如实现爬梯或跳过坑到达更大目标的子目标水平。
他们感到困惑并无法确定前进的道路,而只是随意开始行动。
对于某些游戏,例如弹球,奖励在附近,算法获得所需的外部输入。
然而,在一个冒险游戏中,奖励更加分散,鸡和蛋的情况发展。该程序发现自己无法改善其游戏玩法,直到获得一些奖励,但在改进其游戏玩法之前不会找到奖励。
为了解决这个问题,Zambetta从其他电脑游戏中汲取灵感,如超级马里奥和Pacman,并引入了颗粒奖励,提供了小的中间奖励,并鼓励它探索和完成子目标。
“真正聪明的人工智能需要能够学会在模糊的环境中自主完成任务,”他说。
“我们已经证明,正确的算法可以使用更智能的方法改善结果,而不是纯粹粗暴地在非常强大的计算机上端到端地解决问题。”
这种方法意味着算法将更自然地行动,并且完成子目标的速度比其他AI方法快10倍。
“不仅我们的算法在玩Montezuma"s Revenge时自动识别相关任务的速度比Google DeepMind快10倍,他们还表现出相对类似人类的行为,”Zambetta声称。
“例如,在你可以进入游戏的第二个屏幕之前,你需要确定一些子任务,例如爬梯子,跳过一个敌人,然后最终拿起钥匙,大致按照这个顺序。
“这最终会在很长一段时间后随机发生,但在我们的测试中如此自然地发生了某种意图。
“这使我们成为第一个完全自主的面向目标的代理商,与这些游戏中最先进的代理商真正竞争。”
虽然听起来微不足道,但这项工作在游戏之外可能很重要。根据Zambetta的说法,激励子目标可能有利于控制自动驾驶汽车的算法以及需要机器人助手在现实世界中实现目标的其他情况。
关键词:
责任编辑:孙知兵
免责声明:本文仅代表作者个人观点,与太平洋财富网无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
如有问题,请联系我们!
- 算法帮助AI在传奇的Atari游戏中获胜2023-08-15
- 上半年净利下降九成!消费电子寒冬,千亿芯2023-08-15
- 久其软件分拆华夏电通至北交所:不构成同业2023-08-15
- 2023软科世界大学学术排名发布 湖北新增42023-08-15
- [快讯]直真科技2023H1营收1.14亿元 现金流2023-08-15
- 首钢股份三届三次职代会召开 决定实施企业2023-08-15
- 美的置业9.2亿元融资蹭上“绿色通道”,年内2023-08-15
- 2023重庆智博会展区分布一览2023-08-15
- 多头押注显著增多 原油价格还能走多远2023-08-15
- 创新美食生活,西屋小家电引领时尚烹饪体验2023-08-15
- 下半年稳增长政策仍需加码2023-08-15
- 加盟杨国福麻辣烫,创业不孤独,助力更多加2023-08-15
- 8月15日 今日铂金回收价多少钱一克 最新2023-08-15
- 花钱BIG6!切尔西、阿森纳今夏支出超2亿镑2023-08-15
- 元成股份龙虎榜:营业部净卖出1884.17万元2023-08-15
- 同舟共“冀”!智飞生物向河北省洪涝灾区捐2023-08-15
- 见证企业力量 “影响力指数·2023博鳌风尚2023-08-15
- 侨银环保积极参与公益事业 开展“关爱老人2023-08-15
- 莱茵金属将于今年向乌克兰提供Luna无人机2023-08-15
- 民生银行:金融注活水,助推储能新速度2023-08-15
- 北京奔驰成立十八周年 加速释放战略转型和2023-08-15
- 贝莱德:充分就业停滞将是美国经济又一难题2023-08-15
- “江浙沪独生女”人设背后,是被抹杀的个人2023-08-15
- 破发股慧智微跌2.4%创新低 3个月前上市募2023-08-15
- 远洋“双线”高压作战:美元债待豁免违约,境2023-08-15
- 2023软科世界大学学术排名:中国内地高校上2023-08-15
- 英雄联盟冰雪节是几月几日(英雄联盟冰雪节2023-08-15
- 百融云创行业报告 洞察银行数字化新趋势2023-08-15
- 首开拟8亿接盘与融创合作项目股权债权 意2023-08-15
- 红旗连锁:上半年净利同比增15.23%2023-08-15
精彩推荐
- 美的置业9.2亿元融资蹭上“绿色通道”,...
- 2023重庆智博会展区分布一览
- 见证企业力量 “影响力指数·2023博鳌...
- 莱茵金属将于今年向乌克兰提供Luna无人机
- 贝莱德:充分就业停滞将是美国经济又一难题
- 远洋“双线”高压作战:美元债待豁免违约...
- 2023软科世界大学学术排名:中国内地高...
- 小米智能家庭屏Pro8也迎来了上市首销到...
- 我国外贸今年有哪些新情况?跨境电商成...
- 厦门市政府债券发售 发行规模为2亿元
- 湖人主教练霸气表态:湖人就是能争冠!
- 生态成绩单上新!跟着镜头一起体验绿意中国
- 2023陈奕迅澳门演唱会门票购买的付款方式
- 国家统计局:中国1-7月社会消费品零售总...
- 国家统计局:7月份发电量8462亿千瓦时,...
阅读排行
-
多头押注显著增多 原油价格还能走多远
上一篇2023-08-15 18:45:00