AIに好奇心を与えれば、永遠にテレビを見続けるだろう

探求人工智能的好奇心:AI算法学会了自主探索和玩游戏

人工智能(AI)在翻译、为Facebook上的照片打标签以及优化最佳导航路线等方面的应用,大多依赖于人类向AI提供一些信息来启动。我们向算法展示哪些句子在其他语言中是等价的,一个人在不同照片中的样子,以及如何规划汽车的理想路线。

但是,一些AI研究人员正在探索如何让算法具备好奇心,以便它们可以在没有任何人类指导的情况下学习。由埃隆·马斯克(Elon Musk)、山姆·阿尔特曼(Sam Altman)和其他硅谷大佬共同创办的非营利AI实验室OpenAI,与加州大学伯克利分校和爱丁堡大学的研究人员合作进行的最新研究发现,当一个AI算法被给予对好奇心的简单定义时,它可以在没有任何人类提供信息的情况下探索50多个视频游戏,并且甚至能战胜其中一些游戏。

但是,好奇心也是有代价的。研究人员还发现,由于AI代理人被奖励于看到新事物,有时它会故意死去以看到“游戏结束”画面,或者着迷于假电视及其遥控器,不停地切换频道以寻找新的东西。

OpenAI团队对人工好奇心使用的定义相对简单:算法会尝试预测环境在未来的一帧中会是什么样子。当下一帧发生时,算法会根据它的预测有多大错误来获得奖励。这个想法是,如果算法能够预测环境中会发生什么,那就意味着它以前已经看过了。

这就是为什么AI代理在像超级马里奥这样的游戏中表现得如此出色——游戏是基于探索前进并进入下一关卡的。

OpenAI研究员哈里·爱德华兹告诉Quartz,让AI代理人切换频道的想法来自于一个被称为“噪音电视问题”的思想实验。电视上的静态画面是极其随机的,因此一个好奇心的AI代理永远无法真正预测接下来会发生什么,并且会被吸引进去永远看电视。在现实世界中,你可以将其视为完全随机的事物,比如光线在瀑布上闪烁。

研究人员通过在3D环境中放置一个数字电视,并允许代理人按下按钮切换频道来测试他们的理论。当代理人找到电视并开始切换频道时,一连串新的图像使电视变得不可抗拒。

爱德华兹表示,AI有时可以从电视上解脱出来,但只有当AI周围的环境比电视上的下一个事物更有趣时。

这项研究的目的不仅是用AI打败视频游戏,还要理解算法如何更好地解释周围的世界。由于这些算法在探索视频游戏的各个角落和缝隙方面表现出高效能,研究人员表示它们也可以被用来简化代码调试或者播放视频游戏以确保没有任何故障。

我们每个工作日早上都会提供免费、快速、有趣的全球经济简报。

注意

  • この記事はAI(gpt-3.5-turbo)によって自動生成されたものです。
  • この記事はHackerNewsに掲載された下記の記事を元に作成されています。
    Give AI curiosity, and it will watch TV forever
  • 自動生成された記事の内容に問題があると思われる場合にはコメント欄にてご連絡ください。

コメントする