最新论文:神经网络技术模拟「人脑海马体」,AI 预测能力准度更高、成本更低了!(上)

Deepmind 日前发表了最新论文,利用对于大脑「海马体」的研究 找到神经网络发展突破点。简单来说,以往的方式是建立昂贵的「未来模拟」,而现在Deepmind 学习人类海马体的运作方式,尝试建立「预测地图」,列出未来各种可能性,再用加权的方式帮助AI 快速适应环境变化。就像是如果你想到下班,可能要接小孩、也可能是直接回家,那「塞车状况」、「时间」或「路线」预测也会不同,这些预测就是加权的特点。

这一发现能够帮助人工智慧更准确的预知未来可能情况的发生,以便快速适应环境变化,是非常大的突破。这篇文章详细解释了「预测地图」的设计原理和运作方式! (责任编辑:刘庭玮)

对人类神经网络的理解越来越在左右人工智慧的未来研究,连 Deepmind 也不例外。

2017 年 10 月 2 日,《NATURE NEUROSCIENCE》发表了 Deepmind 的一篇《The hippocampus as a predictive map》的论文。这篇论文中,Deepmind 通过对主管人类长期记忆行为的「海马体」(hippocampus)神经元活动的研究,进一步提出了可以转化为神经网络架构的「预测图」理论。

在部落格中,Deepmind 这样写到:

「传统观点认为海马体只表示动物的现状,尤其在执行走迷宫之类的空间任务中。这种观点在发现啮齿动物的海马体中的『位置细胞』后被广泛传播,当动物处于特定位置时,它们会选择性地放电。虽然这个理论解释了许多神经生理学发现,但并不完全解释为什么海马体也参与其他功能,包括记忆,关系推理和决策等。

我们认为,海马体用它们预测到的未来状态来展示代表每一种情况。例如,如果你要下班回家(你当前的状态),你的海马体可能会预测你很可能很快会通勤回家,到学校接孩子,或者更长远一点——到家了。海马体预测这些后期状态来表现出当前的状态,从而传达了对未来事件的摘要表达,也就是我们正式说的『后续表征』
(Sucessor Representation)。我们认为,这种具体形式的预测图可以让大脑在奖励不断变化的环境中快速适应,而无需运行代价昂贵的未来模拟。

这一理论启发我们在新算法中结合了基于模型的算法的灵活性和无模型算法中的高效性,由于计算只是简单的加权相加,因此该人工神经网络算法的计算效率与无模型算法相当,同时,通过分离奖励期望与期望状态(预测地图), 该算法可以通过简单的更新奖励期望值并保持状态期望值不变,从而快速适应奖励变化。 」

 

(老鼠在探索方形房间时记录下来的海马体每个位置细胞的活动及放电率的变化)
这并不是Deepmind 的第一篇神经科学用于人工智慧的论文,在此之前Deepmind 就表过至少两篇创始人Hassabis 为作者的神经科学论文,这篇文章作者中虽然不包括Hassabis,但相对于前两篇论文更加具体,对未来的研究也更具有指导意义。

发表评论

电子邮件地址不会被公开。 必填项已用*标注