LNDP:赋予人工神经网络「结构可塑性」的自组织神经网络

原文标题:像生物网络一样「生长」,具备「结构可塑性」的自组织神经网络来了

原文作者:机器之心

冷月清谈:

**关键内容**
  • 人工神经网络普遍缺乏生物神经网络的高度可塑性,这限制了它们的适应性和鲁棒性。
  • 研究团队提出了一种称为 LNDP(Lifelong Neural Developmental programs)的自组织神经网络,通过活动和奖励依赖的方式实现突触和结构可塑性。
  • LNDP 包含参数化组件,可定义神经和突触动态,实现结构可塑性(允许动态添加或移除突触)。
  • 引入受生物自发性活动启发的机制,实现预经验发展和组件复用。
  • LNDP 以活动和经验依赖的方式自组织形成功能网络,有效解决控制性任务。

研究成果

  • 在经典控制任务和具有非平稳动态的搜集任务中,具有结构可塑性的 LNDP 模型展示出比无结构可塑性的模型更好的性能。
  • 在非平稳环境中,结构可塑性提高了任务适应性。
  • 预环境自发性活动驱动的发展阶段促进了功能单元的自组织形成。



怜星夜思:


1、LNDP 与现有人工神经网络有何不同?
2、LNDP 的自组织神经发育过程是如何实现的?
3、LNDP 在哪些应用领域有潜力?

原文内容

机器之心报道

机器之心编辑部


生物神经网络有一个重要的特点是高度可塑性,这使得自然生物体具有卓越的适应性,并且这种能力会影响神经系统的突触强度和拓扑结构


然而,人工神经网络主要被设计为静态的、完全连接的结构,在面对不断变化的环境和新的输入时可能非常脆弱。尽管研究人员对在线学习和元学习进行了大量研究,但目前最先进的神经网络系统仍然使用离线学习,因为这与反向传播结合使用时更加简单。


那么,人工神经网络是否也能拥有类似于高度可塑性的性质?


来自哥本哈根信息技术大学的研究团队提出了一种自组织神经网络 ——LNDP,能够以活动和奖励依赖的方式实现突触和结构的可塑性。



  • 论文链接:https://arxiv.org/pdf/2406.09787

  • 项目链接:https://github.com/erwanplantec/LNDP


研究简介

2023 年,Najarro 等人提出了神经发育程序(NDP)模型。但 NDP 在时间上限制在环境前期阶段。因此,哥本哈根信息技术大学的研究团队通过扩展 NDP 框架来解决这一限制。


具体而言,研究团队提出了一种在智能体生命周期内能够实现可塑性和结构变化的机制 ——LNDP(Lifelong Neural Developmental programs)。该机制通过执行局部计算来实现,依赖于人工神经网络中每个神经元的局部活动和环境的全局奖励函数。LNDP 使得人工神经网络具备可塑性,并桥接了间接发育编码(indirect developmental encoding)和元学习的可塑性规则。


LNDP 由一组参数化组件组成,旨在定义神经和突触动态,并使人工神经网络具有结构可塑性(即突触可以动态添加或移除)。



受生物自发性活动(spontaneous activity,SA)的启发,研究团队进一步扩展了系统,引入了一种可实现预经验(pre-experience)发展的机制,用感觉神经元的简单可学习随机过程建模 SA,这使得一些组件可以复用。


研究团队基于 Graph Transformer 层(Dwivedi and Bresson, 2021)提出了一种 LNDP 实例,并在一组强化学习任务中使用协方差矩阵自适应进化策略(CMA-ES)优化了 LNDP。



具体来说,该研究采用了三个经典控制任务(Cartpole、Acrobot、Pendulum)以及一个具有非平稳动态的搜集任务(Foraging),这些任务需要智能体具备生命周期适应性。


总的来说,研究团队展示了从随机连接(或空)神经网络开始, LNDP 以活动和经验依赖的方式,自组织地形成了功能性网络,以有效解决控制性任务。


该研究还表明,在需要快速适应或具有非平稳动态、需要持续适应的环境中,结构可塑性能够改善结果。此外,该研究还展示了基于预环境自发性活动驱动的发展阶段在网络自组织形成功能单元方面的有效性。


实验结果


研究团队在所有任务上测试了 SP 模型(具有结构可塑性的模型)和非 SP 模型(无结构可塑性的模型)之间的差异,结果如下图 2 所示。



在具有非平稳动态的搜集任务(Foraging)上,研究团队发现 SP 模型始终比非 SP 模型达到更高的平均适应度,并且两者达到相似的最大适应度。这表明 SP 在非平稳情况下具有更好的适应性。



在 CartPole 环境中,对于没有 SA 的模型来说,在最开始就达到良好性能特别困难,而具有 SA 的模型在最初就显示出解决任务的固有技能。这展示出模型在非奖励依赖和自组织的方式下实现目标功能网络的能力。




更多研究细节,请参考原论文。



© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:[email protected]

LNDP 使用局部计算和简单的随机过程,高效地实现了网络的可塑性。这使得 LNDP 即使在资源受限的设备上也能实现自组织和在线学习。

LNDP 的自组织和在线学习能力使其在需要快速适应或具有非平稳动态的环境中特别有用。例如,它可以用于机器人、无人驾驶汽车和医疗诊断等领域。

LNDP 有助于解决终身学习和持续适应的挑战。它可以通过不断更新其神经网络,在不断变化的环境中保持高性能,而无需重新训练或人工干预。

LNDP 通过整合间接发育编码和元学习的可塑性规则,同时兼顾了生物神经网络的可塑性和深度学习的强大表示能力。它为人工神经网络提供了更多类似生物体的适应性和灵活性。

LNDP 通过神经元和突触的局部活动以及环境的全局奖励函数,实现了自组织神经发育。每个神经元根据其活动和奖励信号更新其连接权重和神经元参数。通过反复的交互,神经网络逐渐形成了针对特定任务的功能性网络。

LNDP 的生物启发特性使其成为研究神经发育和可塑性机制的宝贵工具。它可以帮助我们更深入地理解大脑如何学习和适应,并为新的计算模型和人工智能算法提供灵感。

LNDP 的独特之处在于其结构可塑性和在线学习能力。传统的 ANN 通常是静态的、完全连接的,而 LNDP 能够在整个生命周期内以活动和奖励依赖的方式动态调整其神经元和突触连接。这种可塑性使 LNDP 能够更好地适应不断变化的环境和新的输入。

LNDP 中的结构可塑性允许动态添加和移除突触连接。这使得神经网络能够根据任务要求灵活地重组其拓扑结构,增强其适应性和鲁棒性。

LNDP 引入了受生物自发性活动启发的机制。在发育早期,神经元经历了一段随机活动阶段,这有助于探索潜在的神经元连接。随着网络的成熟,活动变得更加受奖励信号的影响,促进了针对特定任务的网络自组织。